В последние месяцы Meta представила свою языковую модель large Llama 3.1, которая теперь обновлена до версии Llama 3.2. Обновленная модель стала первой открытой системой искусственного интеллекта, способной одновременно обрабатывать текст и изображения. Разработчикам предоставляется возможность создавать продвинутые приложения, такие как платформы дополненной реальности с распознаванием видео в реальном времени, системы визуального поиска и анализа документов.
Чтобы использовать эту модель, разработчику нужно будет только добавить поддержку мультимодальности и научить работать с изображениями. Компания Meta продолжает развивать свои технологии искусственного интеллекта, и поддержка изображений играет особенно важную роль, поскольку это расширит возможности искусственного интеллекта на различных устройствах, включая очки Ray-Ban Meta.
Пакет Llama 3.2 включает в себя четыре модели: две специально разработанные для обработки изображений (с 11 и 90 миллиардами параметров соответственно) и две более легкие текстовые модели (с 1 и 3 миллиардами параметров соответственно). Модели меньшего размера предназначены для работы на мобильных устройствах с процессорами Qualcomm, MediaTek и другими Arm.
* "Мета" - экстремистская организация, деятельность которой запрещена в России.
]]>