1241 подписчик
Google снижает цены на флэш-память Gemini 1.5, разжигая ценовую войну LLM
🔸 Google снизила цену на флэш-модель Gemini 1.5 на 80% с 12 августа 2024 года.
🔸 Новая стоимость составит 0,075 доллара за миллион входных токенов и 0,3 доллара за миллион выходных токенов.
🔸 Сниженная цена и контекстное кэширование позволяют снизить стоимость и задержку выполнения длинных контекстных запросов.
🔸 Пакетные вызовы API могут еще больше снизить затраты на выполнение задач с высокой задержкой.
🔸 Gemini 1.5 Flash по-прежнему отстает от GPT-4o mini по производительности.
🔸 Снижение цен выгодно разработчикам и предприятиям, но создает проблемы для небольших стартапов в области ИИ.
🔸 Стартапам необходимо продемонстрировать инновации или дифференциацию для обеспечения долгосрочной устойчивости.
🔸 Gemini 1.5 Flash теперь может понимать более 100 языков и отвечать на них.
🔸 Общая доступность выделенной пропускной способности обеспечивает предсказуемость производительности и цены.
Около минуты
2 августа 2024