
Ученые из Массачусетского технологического института (MIT) совершили прорыв, разработав фотонный чип, который способен выполнять все ключевые вычисления нейронной сети с использованием света, значительно ускоряя процесс и снижая энергозатраты. Разработка была представлена в журнале Nature Photonics. Новый фотонный процессор продемонстрировал возможность завершения сложных вычислений, необходимых для классификации данных, за менее чем половину наносекунды. При этом точность его работы составила более 92%, что сопоставимо с результатами традиционных электронных систем.
Глубокие нейронные сети состоят из множества взаимосвязанных слоев нейронов, которые преобразуют входные данные для получения полезного результата. Ключевая часть этих вычислений — умножение матриц, которое выполняется на линейной стадии обработки данных. Однако важнейшим компонентом нейронных сетей являются нелинейные операции, например, активационные функции. Именно они позволяют моделям обучаться сложным паттернам и решать задачи высокой сложности.
В 2017 году группа профессора Дирка Энглунда из MIT представила первый оптический чип для выполнения линейных вычислений с использованием света. Но тогда устройство не могло выполнять нелинейные операции внутри чипа, что требовало конвертации оптических данных в электрические сигналы и их обработки на внешнем цифровом процессоре.

Одной из ключевых трудностей в создании полностью оптической нейронной сети была реализация нелинейных операций. Фотоны, в отличие от электронов, не взаимодействуют друг с другом напрямую, что делает оптические нелинейности сложными и энергозатратными для реализации.
Исследователям удалось преодолеть это ограничение с помощью разработки нелинейных оптических функциональных блоков (NOFU). Эти устройства объединяют электронику и оптику для выполнения нелинейных операций непосредственно на чипе. Они преобразуют небольшую часть света в электрический сигнал с помощью фотодиодов, что позволяет избежать необходимости в энергозатратных внешних усилителях.
Новый фотонный процессор использует три слоя устройств, выполняющих линейные и нелинейные операции. Сначала параметры нейронной сети кодируются в световые сигналы. Затем, с помощью массива программируемых светоделителей, выполняется умножение матриц. Нелинейные операции обрабатываются внутри NOFU, что позволяет сохранять обработку данных в оптической области вплоть до финального результата.

Такая архитектура обеспечивает невероятно низкую задержку и высокую энергоэффективность. Например, процесс обучения нейронной сети прямо на чипе (так называемое in situ обучение) происходит быстрее и с меньшими энергозатратами, чем на традиционном оборудовании. Фотонный процессор показывает впечатляющие результаты: более 96% точности на этапе обучения и более 92% — на этапе предсказания. При этом он выполняет вычисления менее чем за половину наносекунды.
С точки зрения производства, вся схема создана с использованием существующих процессов, применяемых для изготовления CMOS-чипов, что упрощает массовое производство устройства. В будущем это может позволить интегрировать фотонные процессоры с электроникой, например, камерами или телекоммуникационными системами.
В дальнейшем ученые планируют развивать алгоритмы, которые смогут использовать преимущества фотонных систем для ускорения обучения и повышения энергоэффективности. Они также сосредоточатся на масштабировании технологии и ее применении в таких областях, как научные исследования в области астрофизики и физики частиц, а также высокоскоростная телекоммуникация. «Мы теперь можем задуматься о высокоуровневых приложениях и алгоритмах, используя систему, которая выполняет нейросетевые вычисления в оптической области за наносекундные интервалы», — отмечает автор работы Саумил Бандиопадьяй.
Тем временем стало известно, что работающий со «скоростью света» суперкомпьютер будет создан в России.