Преобразующие изменения, вызванные глубоким обучением и искусственным интеллектом, сопровождаются огромными затратами. Например, работа алгоритма OpenAI ChatGPT стоит не менее 100 000 долларов в день. Это можно уменьшить с помощью ускорителей или компьютерного оборудования, предназначенного для эффективного выполнения определенных операций глубокого обучения. Однако такое устройство жизнеспособно только в том случае, если его можно интегрировать с основным вычислительным оборудованием на основе кремния на материальном уровне.
Это мешало внедрению одного многообещающего ускорителя глубокого обучения — массивов электрохимической памяти с произвольным доступом или ECRAM — до тех пор, пока исследовательская группа из Университета Иллинойса в Урбане-Шампейне не добилась первой интеграции ECRAM на уровне материалов с кремниевыми транзисторами. . Исследователи во главе с аспирантом Цзиньсон Цуй и профессором Цин Цао из Департамента материаловедения и инженерии недавно сообщили об устройстве ECRAM, разработанном и изготовленном из материалов, которые можно наносить непосредственно на кремний во время изготовления в Nature Electronics, реализуя первый практический ECRAM . ускоритель глубокого обучения.
«Другие устройства ECRAM были созданы со многими труднодоступными свойствами, необходимыми для ускорителей глубокого обучения, но наше первое обладает всеми этими свойствами и интегрируется с кремнием без проблем с совместимостью», — сказал Цао. «Это был последний серьезный барьер на пути широкого использования технологии».
ECRAM — это ячейка памяти или устройство, которое хранит данные и использует их для вычислений в том же физическом месте. Эта нестандартная вычислительная архитектура устраняет затраты энергии на передачу данных между памятью и процессором, позволяя очень эффективно выполнять операции с интенсивным использованием данных.
ECRAM кодирует информацию, перемещая подвижные ионы между воротами и каналом. Электрические импульсы, подаваемые на клемму затвора, либо вводят ионы в канал, либо вытягивают ионы из канала, и результирующее изменение электропроводности канала сохраняет информацию. Затем он считывается путем измерения электрического тока, протекающего по каналу. Электролит между затвором и каналом предотвращает нежелательный поток ионов, позволяя ECRAM сохранять данные в качестве энергонезависимой памяти.
Исследовательская группа выбрала материалы, совместимые с методами микропроизводства кремния: оксид вольфрама для затвора и канала, оксид циркония для электролита и протоны в качестве подвижных ионов. Это позволило интегрировать устройства в стандартную микроэлектронику и управлять ею. Другие устройства ECRAM вдохновлены неврологическими процессами или даже технологией перезаряжаемых батарей и используют органические вещества или ионы лития, которые несовместимы с микропроизводством кремния.
Кроме того, устройство группы Cao имеет множество других функций, которые делают его идеальным для ускорителей глубокого обучения. «Хотя интеграция кремния имеет решающее значение, идеальная ячейка памяти должна обладать целым рядом свойств, — сказал Цао. «Выбранные нами материалы обладают многими другими желаемыми характеристиками».
Поскольку для выводов затвора и канала использовался один и тот же материал, ввод ионов в канал и вывод ионов из канала являются симметричными операциями, что упрощает схему управления и значительно повышает надежность. Канал надежно удерживает ионы часами, чего достаточно для обучения большинства глубоких нейронных сетей. Поскольку ионами были протоны, самые маленькие ионы, устройства переключались довольно быстро. Исследователи обнаружили, что их устройства выдерживали более 100 миллионов циклов чтения-записи и были намного эффективнее, чем стандартная технология памяти. Наконец, поскольку материалы совместимы с методами микропроизводства, устройства могут быть уменьшены до микро- и наноразмеров, что обеспечивает высокую плотность и вычислительную мощность.
Исследователи продемонстрировали свое устройство, изготовив массивы ECRAM на кремниевых микрочипах для выполнения умножения матрицы на вектор — математической операции, имеющей решающее значение для глубокого обучения. Записи матрицы или веса нейронной сети хранились в ECRAM, и массив выполнял умножение векторных входных данных, представленных в виде приложенных напряжений, используя сохраненные веса для изменения результирующих токов. Эта операция, как и обновление веса, была выполнена с высоким уровнем параллелизма.
«Наши устройства ECRAM будут наиболее полезны для приложений граничных вычислений с искусственным интеллектом, чувствительных к размеру чипа и энергопотреблению», — сказал Цао. «Именно здесь этот тип устройств имеет наиболее значительные преимущества по сравнению с тем, что возможно с ускорителями на основе кремния».
Исследователи патентуют новое устройство и работают с партнерами по полупроводниковой промышленности, чтобы вывести эту новую технологию на рынок. По словам Цао, основное применение этой технологии — в автономных транспортных средствах, которые должны быстро изучать окружающую среду и принимать решения с ограниченными вычислительными ресурсами. Он сотрудничает с факультетом электротехники и вычислительной техники штата Иллинойс для интеграции их ECRAM с изготовленными на заводе кремниевыми чипами, а также с факультетом компьютерных наук штата Иллинойс для разработки программного обеспечения и алгоритмов с использованием уникальных возможностей ECRAM.