Компания Google представила новую технологию под названием TurboQuant. Об этом сообщает Zamin.uz.
Этот метод направлен на снижение требований к памяти, что является одной из самых больших аппаратных проблем систем искусственного интеллекта. Традиционно такие системы полагаются на большие и дорогие чипы, однако подход TurboQuant основан на сокращении объема данных, которые должны храниться в памяти во время генерации текста крупными языковыми моделями.
Это нововведение может иметь важное значение для компаний, разрабатывающих системы искусственного интеллекта, и инвесторов на рынке чипов памяти. В крупных языковых моделях при прогнозировании каждого нового слова или символа происходит повторный доступ к предыдущим данным.
Для этого данные ключей и значений из предыдущих этапов хранятся в специальном кэше. Этот кэш снижает количество повторных вычислений, но его объем увеличивается с добавлением каждого нового слова.
Особенно в длительных диалогах, процессах написания код