Найти тему
1292 подписчика

В курсе, что есть ИИ (открытый код), которые получают на вход изображение, а на выходе дают описание? Ну вот на картинке пример. Это какой-то космически-бомбический результат :) Проверьте сам вот здесь. Я загрузил простой график и она очень точно описала содержимое...


Нет слов, чтобы описать какие открываются возможности для бизнеса.

Цитата:

"ChartGemma - это доработанная версия PaliGemma, созданная Мегом Тхаккаром и его командой, которая отлично справляется с вопросами, касающимися графиков и диаграмм. Идея довольно проста: сначала используйте API с закрытым исходным кодом, например Gemini 1.5 Flash, для сбора обучающих данных, а затем настраивайте на них открытую модель PaliGemma. В итоге вы получаете модель, которая гораздо меньше и дешевле в исполнении для этой специфической нишевой задачи, и она превосходит закрытые API! 🔥"

В курсе, что есть ИИ (открытый код), которые получают на вход изображение, а на выходе дают описание? Ну вот на картинке пример.
Около минуты