В мире инфраструктуры искусственного интеллекта (ИИ) существует одно основное предположение: гибкость — это главное. Мы используем универсальные графические процессоры (GPU), поскольку модели ИИ меняются каждую неделю, и нам нужен программируемый кремний, который может адаптироваться к новым научным прорывам. Но стартап из Торонто под названием Таалас считает, что именно гибкость сдерживает развитие ИИ. По мнению команды Тааласа, если мы хотим, чтобы ИИ стал таким же распространённым и дешёвым, как пластик, нам нужно перестать «симулировать» интеллект на универсальных компьютерах и начать «встраивать» его непосредственно в кремний. Проблема: «стена памяти» и «налог на GPU» Текущие затраты на работу с большими языковыми моделями (LLM) обусловлены физическим узким местом: «стеной памяти». Традиционные процессоры (GPU) основаны на «архитектуре набора команд» (ISA). Они разделяют вычисления и память. Когда вы запускаете процесс логического вывода в модели вроде Llama-3, чип тратит боль
Таалас заменяет программируемые графические процессоры специализированными чипами для искусственного интеллекта
23 февраля23 фев
2 мин