Найти тему
Techno coffee

Первый программируемый компьютер с памятью

Команда Мичигана строит мемристоры на основе стандартной CMOS-логики для демонстрации системы, которая может выполнять различные задачи пограничного компьютерного искусственного интеллекта.

Надеясь ускорить AI и нейроморфные вычисления и снизить энергопотребление, стартапы, ученые и компании, производящие микросхемы, все больше внимания уделяют вычислениям в памяти, а не вычислительному ядру процессора. Мемристоры и другая энергонезависимая память, кажется, особенно хорошо подходят для этой задачи. Тем не менее, большинство демонстраций вычислений в памяти были в автономных ускорителях, которые либо построены для конкретного типа проблемы искусственного интеллекта, либо для работы которых требуются ресурсы отдельного процессора, расположенного вне микросхемы. Инженеры Мичиганского университета утверждают, что это первый программируемый компьютер на основе памяти для искусственного интеллекта, который может работать самостоятельно.

"Память - это действительно узкое место", - говорит профессор Мичиганского университета Вей Лу. "Модели машинного обучения становятся все больше и больше, и у нас не хватает оперативной памяти для хранения весов." Выход за пределы кристалла данных, например, в DRAM, может занять в 100 раз больше вычислительного времени и энергии. По его словам, даже если у вас есть все необходимое для хранения в памяти микросхемы, перемещение ее туда-сюда на вычислительное ядро также требует слишком много времени и энергии. "Вместо этого, ты делаешь вычисления в памяти."

Его лаборатория более десяти лет работает с мемристорами (также называемыми резистивной оперативной памятью или RRAM), которые хранят данные как сопротивление, и демонстрирует механику их потенциала для эффективного выполнения вычислений искусственного интеллекта, таких как операции по умножению и накоплению в центре глубокого изучения. Массивы памяти могут эффективно выполнять эти задачи, поскольку они превращаются в аналоговые вычисления, а не в цифровые.Новый чип сочетает в себе массив из 5,832 мемристоров с процессором OpenRISC. 486 специально разработанных цифро-аналоговых преобразователей, 162 аналого-цифровых преобразователя и два интерфейса смешанных сигналов выполняют функции переводчиков между аналоговыми вычислениями мемристоров и главным процессором.

"Все функции реализованы на чипе, - говорит Лу, сотрудник IEEE. "Чтобы показать перспективу, вы не можете просто построить отдельные части."

На максимальной частоте чип потреблял чуть более 300 милливатт при выполнении 188 миллиардов операций в секунду на ватт (GOPS/W). Это не очень хорошо по сравнению, скажем, с последним исследовательским чипом ускорителя искусственного интеллекта Nvidia со скоростью 9,09 трлн операций в секунду на ватт (TOPS/W), хотя и без учета затрат энергии и задержек передачи данных из DRAM. Но Лу указывает, что часть КМОПа была построена с использованием двухдекадного 180-нанометрового процесса производства полупроводников. Переход на более новый процесс, например, 40-нанометровый процесс 2008 года, позволит снизить энергопотребление до 42 мВт и повысить производительность до 1,37 TOPS/W без необходимости передачи данных из DRAM. Чип Nvidia был сделан с использованием 16-нанометрового процесса, который дебютировал в 2014 году.

Вэй Лу из Мичиганского университета и его соавтор Сын Хван Ли, аспирант в области электротехники, создал программируемую запоминающую систему, которую Ли держит здесь. Команда Lu провела три теста чипа, чтобы доказать его программируемость и способность справляться с широким спектром задач машинного обучения. Самый простой из них называется перцептрон, который используется для засекречивания информации. Для этого мемуристорский компьютер должен был распознавать греческие буквы, даже когда их изображение было шумным.Вторая, и более сложная, задача - проблема разреженности кодирования. В разреженном кодировании вы пытаетесь построить самую эффективную сеть искусственных нейронов, которая позволит вам справиться с поставленной задачей. Это означает, что по мере того, как сеть усваивает свою задачу, нейроны конкурируют друг с другом за место в сети. Проигравшие удаляются, оставляя более мозговидную и эффективную нейронную сеть, имеющую только те связи, которые абсолютно необходимы. Лу продемонстрировал разреженное кодирование на основе памяти в 2017 году на небольшом массиве.Конечной задачей была двухслойная нейронная сеть, способная к так называемому "неконтролируемому обучению". Вместо того, чтобы получать набор помеченных изображений для изучения, микросхеме был присвоен ряд баллов за маммографию. Нейронная сеть сначала выяснила, каковы были важные особенности комбинации баллов, а затем с точностью 94,6 процента выделила злокачественные опухоли из доброкачественных.Следующая версия чипа, которая, по словам Лу, будет выпущена в следующем году, будет иметь как более быстрые, так и более эффективные CMOS и несколько мемристорных массивов. "Мы будем использовать несколько массивов, чтобы показать, что вы можете связать их вместе, чтобы сформировать более крупные сети", - говорит он.Lu создал стартап под названием MemryX с целью коммерциализации чипа. Его предыдущий стартап RRAM, Crossbar, также преследует пространство AI. В прошлом году Crossbar заключил сделку с производителем аэрокосмических бурундуков Microsemi и продемонстрировал чип, который действительно распознавался и читал номерные знаки.