Финские учёные, кажется, нашли способ обойти «бутылочное горлышко» производительности, в которое упёрлись современные нейросети. В Университете Аалто придумали, как проводить сложнейшие тензорные вычисления — основу основ ИИ — буквально с помощью света.
Они пропускают световой импульс через систему всего один раз, и операция готова. Звучит почти как фантастика, но эта технология может, наконец, заменить графические процессоры, которые уже дымятся от аппетитов ИИ.
Читайте: Квантовый интернет – Учёные тестируют восходящую связь Земля-космос
Во что упёрся ИИ
Весь современный ИИ, по сути, держится на тензорных операциях (это такая продвинутая математика с многомерными массивами).
GPU с ними до поры справлялись, но объёмы данных растут лавинообразно, и чипы уже просто не вывозят. Мощности не хватает, а энергопотребление зашкаливает.
Вот эта ситуация и заставила международную команду под руководством доктора Юфэна Чжана искать выход за пределами привычной электроники. Их идея — «однопроходные тензорные вычисления».
Название сложное, но суть изящная. Они берут обычный свет, у которого есть физические свойства — амплитуда и фаза, — и кодируют в них цифровую информацию. А дальше свет просто... летит.
Пока эти модулированные волны распространяются и взаимодействуют друг с другом, они сами, естественным образом, выполняют те же математические расчёты, которые требуются системам глубокого обучения.
Как объясняет сам доктор Чжан, их метод делает ровно то же, что и GPU — все эти свёртки и слои внимания — только делает это буквально со скоростью света.
И что крайне важно, системе не нужна электронная коммутация (переключения), потому что вычисления происходят физически, пока свет в пути.
Вся «магия» — в простоте
Но исследователи пошли ещё дальше: они «раскрасили» свет, использовав сразу несколько длин волн.
Каждая такая волна работает как отдельный, независимый вычислительный канал. Это позволяет системе параллельно обрабатывать тензорные операции более высоких порядков.
Чжан для понятности придумал отличную аналогию с таможней. «Представьте, — говорит он, — что вы таможенник, и вам надо каждую посылку прогнать через кучу разных аппаратов-сканеров... Наш оптический метод — это, как если бы все посылки и все аппараты объединили в один-единственный этап».
Они создали то, что называют «оптическими крючками»: каждый входной сигнал за одну операцию сразу цепляется к правильному выходу.
Интересно, что вся эта «магия» происходит пассивно, то есть без затрат энергии и без каких-либо внешних управляющих схем. Это не только радикально снижает энергопотребление, но и сильно упрощает интеграцию такой системы.
Профессор Чжипэй Сунь, руководящий в Аалто группой фотоники, подтвердил, что метод отлично работает на разных оптических платформах.
В планах — интегрировать всю эту вычислительную архитектуру прямо в фотонные чипы. Если это удастся, сложные ИИ-задачи будут решаться с почти нулевым расходом энергии.
Когда появится в «железе»
Это не такое уж далёкое будущее – команда исследователей ожидает, что технология появится в коммерческом «железе» довольно быстро.
По оценкам доктора Чжана, на интеграцию в платформы, которые создают крупные IT-компании, уйдёт от 3 до 5 лет. Зачем это нужно?
Такие системы кардинально ускорят ИИ в тех областях, где счёт идёт на доли секунды: анализ изображений в реальном времени, сложные научные симуляции, да и те же большие языковые модели.
Кроме того, это поможет решить проблему энергопотребления нейросетей — проблему, которая с каждой новой моделью ИИ становится всё острее. Возможно, мы действительно на пороге появления нового поколения оптических компьютеров.
Хочу первым узнавать о ТЕХНОЛОГИЯХ – ПОДПИСАТЬСЯ на Telegram
Читать свежие обзоры гаджетов на нашем сайте – TehnObzor.RU