На недавно прошедшей в Лас-Вегасе конференции re:Invent, Amazon Web Services (AWS) объявила о запуске новых поколений AI чипов Trainium2 и Graviton4. Trainium2, предназначенный для обучения моделей, обещает улучшить производительность в четыре раза и энергоэффективность в два раза по сравнению с предыдущей моделью. Это позволит программистам быстрее и дешевле обучать модели за счет сокращения потребления энергии. Компания Anthropic уже заявила о планах построения моделей с использованием чипов Trainium2.
Graviton4, ориентированный на более широкое использование, обещает повышение общей производительности на 30% при использовании обученных AI моделей. Эти процессоры, построенные на архитектуре Arm, потребляют меньше энергии, чем чипы Intel или AMD, что должно снизить затраты на облачные вычисления и немного ускорить работу для обычных пользователей.
Вопреки ожиданиям, Amazon укрепляет свои отношения с NVIDIA, предлагая корпоративным клиентам облачный доступ к последним AI GPU NVIDIA H200. Кроме того, AWS будет использовать более 16 000 суперчипов NVIDIA GH200 Grace Hopper для исследовательских нужд NVIDIA.
Amazon также анонсировала запуск нового бизнес-ориентированного AI чат-бота Q, предназначенного для упрощения рабочих проектов и задач обслуживания клиентов. Он может быть адаптирован для любого бизнеса и предоставлять релевантные ответы на часто задаваемые вопросы. Amazon Q в настоящее время доступен в предварительной версии, а его широкий выпуск запланирован на ближайшее время. Стоимость использования будет варьироваться от $20 до $30 на пользователя в месяц в зависимости от доступных функций.