Найти тему

ВзглядИзБездны 05.02-11.02.2024

Оглавление

Первая виртуальная ИИ-личность в Китае

Китайские ученые представили виртуальную девочку «Тонг Тонг» на выставке в Пекине. Это первая в мире «виртуальная сущность искусственного интеллекта», способная самостоятельно ставить перед собой задачи, обучаться и исследовать окружающую среду. Посетители могли взаимодействовать с «Тонг Тонг», которая понимала человеческие намерения. ИИ-девочка отличала добро от зла, испытывала радость, гнев и печаль. Ее уровень мышления и поведение сопоставимы со способностями четырехлетнего ребенка. Создание сущности, которая имеет здравый смысл и понимает реальный мир, будет существенным шагом навстречу общему ИИ, считают разработчики.

Gemini Ultra

Главной техноновостью недели стал запуск Gemini Ultra — мультимодальной нейросети от Google. Компания утверждает, что она обходит GPT-4 на нескольких бенчмарках, измеряющих качество ответов языковых моделей. По заявлению компании, это первая модель, которая превзошла экспертов-людей в тесте MMLU.

Судя по всему, Google делает большую ставку на эту нейросеть: она переименовала своего чат-бота Bard в Gemini и предлагает использовать его вместо Google Assistant на смартфонах в качестве основного цифрового помощника. Компания объединила доступ к Gemini Ultra с подпиской Google One. Она стоит те же 20 долларов, что и доступ к GPT-4, но даёт гораздо больше возможностей.

Скрытые знаки

-2

Генерации от DALL-E 3 будут помечаться цифровым водяным знаком C2PA. Это невидимый для пользователей символ, который показывает, создано ли изображение нейросетью.

AR-очки Frame

-3

Экс-сотрудник Apple представил AR-очки Frame — они в 10 раз дешевле Vision Pro. Гаджет оснащён проекционным дисплеем и функциями на основе нейросетей Perplexity AI, Stability AI, GPT4 и Whisper. Сейчас на Frame можно оформить предзаказ.

Еще одна нейронка

-4

Apple выпустила модель машинного обучения MGIE (MLLM-Guided Image Editing), предназначенную для редактирования изображений по текстовому описанию. Нейросеть разрабатывали совместно с исследователями Калифорнийского университета в Санта-Барбаре. MGIE — мультимодальная модель, которая умеет работать с несколькими типами данных. К примеру, нейросеть может распознавать команды на естественном языке, образы на исходной фотографии и генерировать новые объекты с помощью диффузионной модели. Такой подход позволяет объединить несколько задач в одной нейросети.

Робот-моноцикл с ногами

-5

Американские инженеры разработали робомоноцикл. Он представляет собой колесо, внутри которого есть мотор и две робоноги. Во время остановки робот использует их, чтобы стоять на месте, а во время езды они помогают ему поворачивать, смещая центр масс.