Найти в Дзене

🛠💰 Внутри лаборатории Amazon Trainium: чипы, на которых работают Anthropic, Apple и теперь OpenAI

Пока весь мир стоит в очереди за чипами NVIDIA, Amazon тихой сапой выстроила вторую по силе инфраструктуру для ИИ. Сейчас развернуто уже 1.4 миллиона чипов Trainium трех поколений, и спрос на них растет быстрее, чем производство. Главный показатель успеха — тотальный переход Anthropic на это железо: модели Claude крутятся на кластере из более чем 1 миллиона чипов Trainium2. Даже OpenAI, несмотря на тесную связь с Microsoft, заключила с Amazon сделку на $50 миллиардов, чтобы получить доступ к 2 гигаваттам вычислительной мощности на базе Trainium для своего нового строителя агентов Frontier. Изначально Trainium проектировался для обучения (training), но сейчас фокус сместился на инференс (inference — запуск готовых моделей). Именно инференс стал главным бутылочным горлышком индустрии, и решение от AWS позволяет делать это значительно дешевле и быстрее, чем на универсальных GPU. Для разработчиков это сигнализирует о конце монополии одного вендора: сервис Amazon Bedrock уже перевел боль

🛠💰 Внутри лаборатории Amazon Trainium: чипы, на которых работают Anthropic, Apple и теперь OpenAI

Пока весь мир стоит в очереди за чипами NVIDIA, Amazon тихой сапой выстроила вторую по силе инфраструктуру для ИИ. Сейчас развернуто уже 1.4 миллиона чипов Trainium трех поколений, и спрос на них растет быстрее, чем производство.

Главный показатель успеха — тотальный переход Anthropic на это железо: модели Claude крутятся на кластере из более чем 1 миллиона чипов Trainium2. Даже OpenAI, несмотря на тесную связь с Microsoft, заключила с Amazon сделку на $50 миллиардов, чтобы получить доступ к 2 гигаваттам вычислительной мощности на базе Trainium для своего нового строителя агентов Frontier.

Изначально Trainium проектировался для обучения (training), но сейчас фокус сместился на инференс (inference — запуск готовых моделей). Именно инференс стал главным бутылочным горлышком индустрии, и решение от AWS позволяет делать это значительно дешевле и быстрее, чем на универсальных GPU.

Для разработчиков это сигнализирует о конце монополии одного вендора: сервис Amazon Bedrock уже перевел большую часть своего трафика на Trainium2. Если раньше кастомное железо облачных провайдеров считалось компромиссом, то сейчас это основной инструмент для гигантов уровня Apple и OpenAI, позволяющий масштабировать агентов без оглядки на дефицит видеокарт.

#AI #Hardware #Amazon #Trainium #AWS #Anthropic #OpenAI

🔗 An exclusive tour of Amazon’s Trainium lab, the chip that’s won over Anthropic, OpenAI, even Apple