Система обходит узкое место в вычислениях при настройке алгоритмов искусственного интеллекта
Простая электрическая цепь научилась распознавать цветы по размеру их лепестков. Это может показаться тривиальным по сравнению с системами искусственного интеллекта (ИИ), которые распознают лица в толпе, транскрибируют произносимые слова в текст и выполняют другие поразительные трюки . Тем не менее, крошечная схема превосходит обычные системы машинного обучения в одном ключевом отношении: она обучается сама без какой-либо помощи компьютера — подобно живому мозгу. Результат демонстрирует один из способов избежать огромного объема вычислений, который обычно требуется для настройки системы ИИ, — проблема, которая может стать большим препятствием по мере того, как такие программы становятся все более сложными.
«Это доказательство принципа», — говорит Сэмюэл Диллаву, физик из Пенсильванского университета, который представил свою работу на этой неделе на ежегодном мартовском собрании Американского физического общества. «Мы узнаем что-то об обучении».
В настоящее время стандартным инструментом машинного обучения является искусственная нейронная сеть. Такие сети обычно существуют только в памяти компьютера, хотя некоторые исследователи нашли способы воплотить их в повседневных предметах . Нейронная сеть состоит из точек или узлов, каждый из которых может принимать значение от 0 до 1, соединенных линиями или ребрами. Каждое ребро взвешивается в зависимости от того, насколько коррелированы или антикоррелированы два узла.
Узлы расположены слоями, причем первый слой принимает входные данные, а последний слой производит выходные данные. Например, первый слой может принимать в качестве входных данных цвет пикселей на черно-белых фотографиях. Выходной слой может состоять из одного узла, который возвращает 0, если на картинке изображена кошка, и 1, если на ней изображена собака.
Чтобы обучить систему, разработчики обычно предъявляют ей набор обучающих изображений и регулируют веса ребер, чтобы получить правильный результат. Это сложная проблема оптимизации, которая значительно усложняется с увеличением размера сети и требует значительной компьютерной обработки, отличной от самой нейронной сети. Ситуация усложняется тем, что все ребра во всей сети должны настраиваться одновременно, а не одно за другим. Чтобы обойти эту проблему, физики искали физические системы, которые могли бы эффективно настраивать себя без внешних вычислений.
Теперь Диллаву и его коллеги разработали систему, которая может сделать именно это. Они собрали небольшую сеть, случайным образом соединив вместе 16 общих электрических компонентов, называемых регулируемыми резисторами, как многие ершики для труб. Каждый резистор служит ребром в сети, а узлы — это соединения, в которых встречаются выводы резисторов. Чтобы использовать сеть, исследователи устанавливают напряжения для определенных входных узлов и считывают напряжения выходных узлов. Регулируя резисторы, автоматизированная сеть научилась производить желаемые выходные данные для заданного набора входных данных.
Чтобы обучить систему с минимальным объемом вычислений и памяти, исследователи фактически построили две идентичные сети друг над другом. В «зажатой» сети они подавали входные напряжения и фиксировали выходное напряжение на желаемом значении. В «свободной» сети они фиксировали только входное напряжение, а затем позволяли всем остальным напряжениям плавать до любого значения, которое они хотели, что обычно давало неправильное напряжение на выходе.
Затем система регулировала сопротивления в двух сетях в соответствии с простым правилом, которое зависело от того, была ли разница напряжений на резисторе в ограниченной сети больше или меньше, чем разница напряжений на соответствующем резисторе в свободной сети. После нескольких итераций эти корректировки привели все напряжения во всех узлах в двух сетях в соответствие и научили обе сети выдавать правильный выход для заданного входа.
Важно отметить, что эта настройка требует очень мало вычислений. По словам Диллаву, системе нужно только сравнить падение напряжения на соответствующих резисторах в замкнутой и свободной сетях с помощью относительно простого электрического устройства, называемого компаратором.
Сеть была настроена для выполнения множества простых задач ИИ, сообщил Диллаву на встрече. Например, он мог различать три вида ириса с точностью более 95 % в зависимости от четырех физических параметров цветка: длины и ширины его лепестков и чашелистиков — листьев чуть ниже цветка. По словам Диллаву, это канонический тест ИИ, в котором используется стандартный набор из 150 изображений, 30 из которых использовались для обучения сети.
Однако кажется маловероятным, что сеть резисторов когда-либо заменит стандартные нейронные сети. Во-первых, его реакция на различные входные данные, вероятно, должна различаться более резко, если сеть резисторов должна соответствовать способности искусственной нейронной сети делать тонкие различия, говорит Диваллоу.
Но Джейсон Рокс, физик из Бостонского университета, говорит, что не исключено, что эта идея может иметь некоторую технологическую ценность. «Если он состоит из электрических компонентов, вы сможете уменьшить его масштаб до микрочипа», — говорит он. «Я думаю, что именно к этому они и идут».