Чатботы стали привычным продуктом для многих. Однако ждать по 5-7 секунд генерации ответа в chatGPT некомильфо. Это крайне долго для технологического adoption. Дело в используемом железе. Хоть чипы Nvidia и творят чудеса, но GPU не были заточены под задачи генеративного ИИ. На сцену выходит новое поколение чипов LPU (language processing unit) от стартапа Groq, основанного в 2016 году создателем гугловских процессоров TPU Джонатом Рассом. LPU — кастомные чипы (подобно ASICам в майнинге биткоина), заточенные под задачу обработки и генерации текста. Чипы Groq справляются с задачами чатбота в среднем в 10 раз быстрее, чем Nvidia!Обрабатывая более 300 токенов в секунду! И это на чипах 2022 года (14 нм). Каков же будет разрыв, когда они запустят 4нм в 2024? Успех возможен благодаря архитектуре LPU — оперативная память находится прямо в чипе, что значительно снижает время на передачу сигнала. Причем Groq решил и другую проблему. Он не зависит от тайваньского TSMC. Чипы Groq на 100% проектирую