В среду на конференции Meta Connect 2024 генеральный директор Марк Цукерберг вышел на сцену, чтобы рассказать о последних достижениях своей компании в области искусственного интеллекта. По его словам, это «вероятно, самая большая новость в области ИИ», Цукерберг представил Natural Voice Interactions, прямого конкурента Gemini Live от Google и Advanced Voice Mode от OpenAI.
«Я думаю, что голос станет более естественным способом взаимодействия с ИИ, чем текст», - прокомментировал Цукерберг. «Я думаю, что он может стать одним из самых частых способов взаимодействия с ИИ, если не самым частым». Цукерберг также сообщил, что новая функция начнет распространяться среди пользователей уже сегодня во всех основных приложениях Meta, включая Instagram, WhatsApp, Messenger и Facebook.
«Meta AI выделяется в этой категории тем, что не просто предлагает самые современные модели искусственного интеллекта, но и предоставляет неограниченный доступ к ним для бесплатной интеграции в наши различные продукты и приложения», - сказал Цукерберг. «Meta AI находится на пути к тому, чтобы стать самым используемым ИИ-ассистентом в мире. Мы почти достигли отметки в 500 миллионов ежемесячных пользователей, а ведь мы еще даже не запустились в некоторых крупных странах».
Как и Gemini Live и Advanced Voice Mode, Natural Voice Interactions позволяет пользователям отказаться от текстовых подсказок и говорить напрямую с чатботом. Пользователи могут запинаться, поправлять себя, перебивать ИИ и вообще говорить так, как они говорили бы с другим человеком, и при этом чатбот будет следить за ходом беседы. Новая функция также позволит пользователям выбирать голос искусственного интеллекта, в том числе Джона Сины, Дэйм Джуди Денч, Кристен Белл, Кигана Майкла Ки и Анквафины. Возможно, вы помните этот состав по предыдущей попытке Meta создать чат на естественном языке, которая была закрыта в августе, поскольку пользователи сочли взаимодействие «жутким» и «сюрреалистичным».
Цукерберг продемонстрировал работу этой функции на сцене, задав чатботу ряд вопросов, на которые ИИ удовлетворительно ответил. Его речь показалась немного скованной и менее разговорной, чем в расширенном голосовом режиме, но все же она была намного лучше, чем монотонные интонации, которые можно получить от ответа Siri. Однако только когда Цукерберг назвал искусственный интеллект Awkwafina, репортер понял, что это и есть тот самый голос.
Получите Microsoft Office для Windows/Mac за 25 долларов
Естественное голосовое взаимодействие стало «вероятно, самой большой» новостью об ИИ, объявленной в среду, но это было далеко не единственное объявление. Цукерберг также сообщил, что модель Meta's Llama достигла версии 3.2, в которой система стала мультимодальной. Llama 3.2 11B и 90B (по количеству параметров, на которых обучалась каждая модель) теперь могут интерпретировать графики и диаграммы, определять объекты на изображениях, а также генерировать подписи к изображениям.
К сожалению, эти новые модели не будут доступны в Европе. Это связано с тем, что Meta называет ЕС «непредсказуемой» нормативной средой, которая не позволяет компании использовать данные европейцев для обучения своих моделей ИИ. Компания запускает в Европе пару очень легких моделей, получивших названия Llama 3.2 1B и 3B, ни одна из которых не обучалась на европейских данных. Эти модели предназначены для смартфонов и других периферийных устройств.
По непонятным причинам Meta также объявила о начале испытаний новой функции, которая будет вставлять созданные искусственным интеллектом изображения - некоторые из них могут включать ваше изображение - прямо в ваши ленты Facebook и Instagram. Эти изображения «Imagined for You» будут побуждать пользователей либо поделиться изображением как есть, либо доработать его в приложении и в режиме реального времени.
«Я думаю, что со временем наметилась тенденция, когда лента стала в первую очередь и исключительно контентом для людей, за которыми вы следите, ваших друзей», - сказал Цукерберг в недавнем интервью The Verge. «И вы просто добавляете к этому слой: «Хорошо, и мы также собираемся показать вам контент, сгенерированный системой искусственного интеллекта, который может быть вам интересен»... Насколько большим он станет, зависит от исполнения и того, насколько он хорош».
Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!