48 подписчиков

Meta выпускает самую большую и лучшую модель искусственного интеллекта с открытым исходным кодом на сегодняшний день

24 июля 202424 июл 2024

6 мин

Llama 3.1 превосходит OpenAI и других конкурентов по некоторым показателям. Теперь Марк Цукерберг ожидает, что помощник Meta по искусственному интеллекту превзойдет использование ChatGPT в ближайшие месяцы. Еще в апреле Meta дразнила, что работает над первой для индустрии искусственного интеллекта моделью с открытым исходным кодом, производительность которой соответствует лучшим частным моделям таких компаний, как OpenAI. Сегодня эта модель появилась. Meta выпускает Llama 3.1, крупнейшую в истории модель искусственного интеллекта с открытым исходным кодом, которая, по утверждению компании, превосходит GPT-4o и Anthropic Claude 3.5 Sonnet по нескольким показателям. Meta AI assistant на базе Llama также становится доступным в большем количестве стран и языков, добавляя функцию, которая может генерировать изображения на основе чьего-либо конкретного сходства. Генеральный директор Марк Цукерберг теперь прогнозирует, что Meta AI станет наиболее широко используемым помощником к концу этого г

Еще в апреле Meta дразнила, что работает над первой для индустрии искусственного интеллекта моделью с открытым исходным кодом, производительность которой соответствует лучшим частным моделям таких компаний, как OpenAI.

Сегодня эта модель появилась. Meta выпускает Llama 3.1, крупнейшую в истории модель искусственного интеллекта с открытым исходным кодом, которая, по утверждению компании, превосходит GPT-4o и Anthropic Claude 3.5 Sonnet по нескольким показателям. Meta AI assistant на базе Llama также становится доступным в большем количестве стран и языков, добавляя функцию, которая может генерировать изображения на основе чьего-либо конкретного сходства. Генеральный директор Марк Цукерберг теперь прогнозирует, что Meta AI станет наиболее широко используемым помощником к концу этого года, превзойдя ChatGPT.

Llama 3.1 значительно сложнее, чем меньшие модели Llama 3, которые вышли несколько месяцев назад. Самая большая версия имеет 405 миллиардов параметров и была обучена более чем на 16 000 сверхдорогих графических процессорах H100 от Nvidia. Meta не раскрывает стоимость разработки Llama 3.1, но, исходя из стоимости одних только чипов Nvidia, можно с уверенностью предположить, что речь шла о сотнях миллионов долларов.

Итак, учитывая стоимость, почему Meta продолжает раздавать Llama с лицензией, которая требует одобрения только компаний с сотнями миллионов пользователей? В письме, опубликованном в блоге компании Meta, Цукерберг утверждает, что модели ИИ с открытым исходным кодом превзойдут — и уже совершенствуются быстрее, чем — проприетарные модели, подобно тому, как Linux стала операционной системой с открытым исходным кодом, которая сегодня поддерживает большинство телефонов, серверов и гаджетов.

“Переломный момент в отрасли, когда большинство разработчиков начинают преимущественно использовать открытый исходный код”

Он сравнивает инвестиции Meta в ИИ с открытым исходным кодом с ее более ранним проектом Open Compute, который, по его словам, спас компании “миллиарды” благодаря тому, что сторонние компании, такие как HP, помогли улучшить и стандартизировать дизайн центров обработки данных Meta, поскольку она наращивала собственные мощности. Заглядывая в будущее, он ожидает, что та же динамика будет наблюдаться и с ИИ, написав: “Я считаю, что выпуск Llama 3.1 станет переломным моментом в отрасли, где большинство разработчиков начнут в основном использовать открытый исходный код”.

Чтобы помочь вывести Llama 3.1 в мир, Meta сотрудничает с более чем двумя десятками компаний, включая Microsoft, Amazon, Google, Nvidia и Databricks, помогая разработчикам внедрять их собственные версии. Meta утверждает, что запуск в производство Llama 3.1 стоит примерно вдвое дешевле GPT-4o от OpenAI. Компания публикует весовые коэффициенты модели, чтобы компании могли обучать ее на пользовательских данных и настраивать по своему вкусу.

Gemini не включена в эти сравнительные тесты, потому что Meta было сложно использовать API Google для воспроизведения ранее заявленных результатов, по словам представителя Meta Джона Карвилла.

Список ключевых партнеров Meta и возможности, которые они предлагают для развертывания Llama 3.1.

Неудивительно, что Meta мало что говорит о данных, которые она использовала для обучения Llama 3.1. Люди, работающие в компаниях, занимающихся искусственным интеллектом, говорят, что они не раскрывают эту информацию, потому что это коммерческая тайна, в то время как критики говорят, что это тактика, позволяющая отсрочить неизбежный натиск грядущих судебных процессов по авторским правам.

Что скажет Meta, так это то, что она использовала синтетические данные, или данные, сгенерированные моделью, а не людьми, чтобы версия Llama 3.1 с 405 миллиардами параметров улучшила меньшие версии с 70 миллиардами и 8 миллиардами. Ахмад Аль-Дахле, вице-президент Meta по генеративному ИИ, прогнозирует, что Llama 3.1 будет популярна среди разработчиков как ”учитель для моделей меньшего размера, которые затем развертываются“ "более экономичным способом”.

Когда я спрашиваю, согласна ли Meta с растущим консенсусом о том, что в отрасли заканчиваются качественные обучающие данные для моделей, Аль-Дахле предполагает, что приближается предел, хотя он может быть дальше, чем некоторые думают. “Мы определенно думаем, что у нас есть еще несколько [обучающих] запусков”, - говорит он. “Но трудно сказать”.

Впервые в рамках red teaming (или состязательного тестирования) Llama 3.1 Meta провела поиск потенциальных вариантов использования в области кибербезопасности и биохимии. Еще одна причина более тщательного тестирования модели заключается в том, что Meta описывает как появляющееся ”агентированное" поведение.

Например, Аль-Дахле говорит мне, что Llama 3.1 способна интегрироваться с API поисковой системы для “извлечения информации из Интернета на основе сложного запроса и последовательного вызова нескольких инструментов для выполнения ваших задач”. Другой пример, который он приводит, - просит модель отобразить количество домов, проданных в Соединенных Штатах за последние пять лет. “Она может получить ваш поиск [в Интернете], сгенерировать код Python и выполнить его ”.

Собственная реализация Llama от Meta - это ее AI assistant, который позиционируется как чат-бот общего назначения, подобный ChatGPT, и его можно найти практически во всех Instagram, Facebook и WhatsApp. Начиная с этой недели, Llama 3.1 впервые будет доступна через WhatsApp и веб-сайт Meta AI в США, а в ближайшие недели Instagram и Facebook. Она также обновляется для поддержки новых языков, включая французский, немецкий, хинди, итальянский и испанский.

В то время как самую совершенную модель с 405 миллиардами параметров Llama 3.1 можно использовать бесплатно в Meta AI, ассистент переключит вас на более урезанную модель с 70 миллиардами параметров после превышения неопределенного количества запросов за данную неделю. Это говорит о том, что модель стоимостью 405 миллиардов долларов слишком дорога для запуска Meta в полном масштабе. Представитель Джон Карвилл говорит мне, что компания предоставит дополнительную информацию о пороге быстрого запуска после оценки раннего использования.

Новая функция “Imagine Me” в Meta AI сканирует ваше лицо с помощью камеры вашего телефона, чтобы затем позволить вам вставлять свое сходство в создаваемые ею изображения. Мы надеемся, что, запечатлевая ваше сходство таким образом, а не с помощью фотографий в вашем профиле, Meta избегает создания машины для глубокой подделки. Компания видит спрос на людей, желающих создавать больше видов медиа с искусственным интеллектом и делиться ими в своих лентах, даже если это означает стирание грани между тем, что явно реально, и тем, что нет.

В ближайшие недели Meta AI также появится в гарнитуре Quest, заменив интерфейс голосовых команд. Как и ее реализация в очках Meta Ray-Ban, вы сможете использовать Meta AI в квесте, чтобы определять и узнавать, на что вы смотрите, находясь в сквозном режиме гарнитуры, который показывает реальный мир через дисплей.

“Я думаю, что вся индустрия все еще находится на ранней стадии своего пути к выходу продукта на рынок”

Помимо прогноза Цукерберга о том, что Meta AI станет наиболее используемым чат-ботом к концу этого года (у ChatGPT более 100 миллионов пользователей), Meta пока не сообщила никаких данных об использовании своего помощника. “Я думаю, что вся индустрия все еще находится на ранней стадии продвижения продукта на рынок”, - говорит Аль-Дахле. Несмотря на то, что искусственный интеллект уже может показаться чрезмерно распространенным, ясно, что Meta и другие игроки думают, что гонка только начинается.

Оригинал статьи: TheVerge