Представьте себе мир, в котором одно устройство выступает в качестве пользовательского интерфейса и удаленно подключено ко второму устройству, выполняющему фактические вычисления.itWeek
В результате рабочие нагрузки генеративного ИИ размещаются в дата-центрах с дорогостоящей сетью промышленных GPU, где ресурсы объединяются.itWeek
Если коротко, то локальные модели меняют все для разработчиков генеративного ИИ, и приложения, которые полагаются на облачные модели, рискуют стать устаревшими.itWeek
Первая причина заключается в том, что из-за стоимости графических процессоров генеративный ИИ сломал модель почти нулевых предельных издержек, которой пользуется SaaS.itWeek