Найти тему
1245 подписчиков

Выложили в открытом доступе (вот здесь) интерфейс к llama3.2 (которая мультимодальная).


Позволю себе цитату автора:

"LLaMa 3.2 Multimodal Web UI - это удобный интерфейс для взаимодействия с мультимодальной моделью LLaMa 3.2 платформы Ollama. Он поддерживает ввод текста и изображений, позволяя пользователям задавать вопросы, отправлять подсказки и получать ответы в виде текста, кода и даже визуального вывода, делая возможности мультимодального ИИ доступными для всех."

В общем если коротко - ставьте и работайте с новой ИИ, включая загрузку картинок (можете попросить описать изображение и т.п.). Я имею ввиду на своем ПК ставите клиента, а где сервер не знаю :) (или не понял данный момент, кажется на ollama где-то в облаке, да не важно для тестов)...

Выложили в открытом доступе (вот здесь) интерфейс к llama3.2 (которая мультимодальная).  Позволю себе цитату автора:  "LLaMa 3.
Около минуты