Найти тему
РР-Новости

Компания Meta представила первую открытую систему искусственного интеллекта, которая может обрабатывать как изображения, так и текст

В последние месяцы Meta представила свою языковую модель large Llama 3.1, которая теперь обновлена до версии Llama 3.2. Обновленная модель стала первой открытой системой искусственного интеллекта, способной одновременно обрабатывать текст и изображения. Разработчикам предоставляется возможность создавать продвинутые приложения, такие как платформы дополненной реальности с распознаванием видео в реальном времени, системы визуального поиска и анализа документов.

Чтобы использовать эту модель, разработчику нужно будет только добавить поддержку мультимодальности и научить работать с изображениями. Компания Meta продолжает развивать свои технологии искусственного интеллекта, и поддержка изображений играет особенно важную роль, поскольку это расширит возможности искусственного интеллекта на различных устройствах, включая очки Ray-Ban Meta.

Пакет Llama 3.2 включает в себя четыре модели: две специально разработанные для обработки изображений (с 11 и 90 миллиардами параметров соответственно) и две более легкие текстовые модели (с 1 и 3 миллиардами параметров соответственно). Модели меньшего размера предназначены для работы на мобильных устройствах с процессорами Qualcomm, MediaTek и другими Arm.

* "Мета" - экстремистская организация, деятельность которой запрещена в России.

]]>