Найти тему
113 подписчиков

2 примера, иллюстрирующие способность небольшой мультимодальной модели Fuyu-8B от команды AdeptAILabs, понимать визуальную информацию, соотносить ее с задаваемыми ей вопросами и отвечать на них


Вопрос 1: Если в пищевой сети, отсутствуют иголки пихты Дугласа, то какой организм будет голодать?
Ответ: Рыжая полевка (Red tree vole)

Вопрос 2: В скольких сериях снимался Aidan Gillen?
Ответ: В двух

Конечно, мы могли бы по-прежнему утверждать, что это - не понимание в человеческом смысле
А вы знали ответы на эти вопросы?
Около минуты