Найти тему
Лямин

6 удивительных событий 2022 года, которые подарил нам искусственный интеллект

2022-й был довольно интересным для искусственного интеллекта (ИИ). Он научился создавать впечатляющие изображения по текстовому описанию, а также текст и музыку. В этой небольшой заметке 6 самых главных событий.

Апрель: фантазии DALL-E 2 в картинках

-2

В апреле OpenAI анонсировала DALL-E 2 — обучаемую модель для синтеза изображения, которая способна создавать картинки по текстовому описанию. Она была обучена на сотнях миллионов изображений из открытого доступа.

-3

Буквально после этого соцсети наводнили изображения, которые впечатляли своей реалистичностью — все они были созданы нейросетью. В конце сентября DALL-E 2 стала доступна для всех желающих.

Июль: инженер из Google считает нейросеть LaMDA разумной

Washington Post
Washington Post

В начале июля газета Washington Post сообщила, что инженер Google по имени Блейк Лемуан был отправлен в оплачиваемый отпуск в связи с его убеждением, что разработанная Google языковая модель LaMDA — разумна и заслуживает прав человека.

Работая в составе организации Google Responsible AI, Лемуан начал общаться с LaMDA о религии и философии и поверил, что видит за текстом настоящий интеллект. По словам Google, LaMDA говорила Лемуану только то, что он хотел услышать, и она на самом деле не является разумной. Как и инструмент генерации текста GPT-3, LaMDA ранее был обучена на миллионах книг и веб-сайтов.

Попутно Лемуан якобы нарушил политику конфиденциальности Google, рассказав о работе своей группы. Позже, в июле, Google уволила Лемуана за нарушение политики безопасности данных.

Июль: DeepMind AlphaFold предсказывает почти все известные структуры белков

Sloan-Kettering
Sloan-Kettering

В июле компания DeepMind объявила, что их ИИ AlphaFold предсказал форму почти всех известных белков, которые входят в состав большинства организмов на Земле с секвенированным геномом. Изначально анонсированная летом 2021 года, AlphaFold ранее предсказала форму всех человеческих белков. Но уже через год ее база данных расширилась и теперь содержит более 200 миллионов белковых структур.

DeepMind разместила предсказанные структуры белков в общедоступной базе данных Европейского института биоинформатики при Европейской лаборатории молекулярной биологии (EMBL-EBI), что позволяет исследователям со всего мира получить к ним доступ и использовать для исследований, связанных с медициной и биологическими науками.

Белки — это основные строительные блоки жизни, и знание их формы может помочь ученым контролировать или изменять их. Это особенно полезно при разработке новых лекарств.

Август: Stable Diffusion открывает код

-6

Компании Stability AI и CompVis 22 августа выпустили Stable Diffusion 1.4 — модель для синтеза изображений, аналог DALL-E 2 от OpenAI. DALL-E 2 — закрытая модель со значительными ограничениями, а исходный код Stable Diffusion открыт. Также пользователи могут использовать её локально и конфиденциально на своих ПК с мощной графикой.

-7

Энтузиасты тепло приняли открытый код Stable Diffusion и создали вокруг него экосистему. Таким образом появились интеграции нейросети в различные продукты (сайты и приложения). Сейчас уже актуальна версия Stable Diffusion под номером 2.1.

Август: изображение, созданное искусственным интеллектом, получает первую награду

-8

В начале августа житель Колорадо (США) по имени Джейсон Аллен представил три изображения, сгенерированные искусственным интеллектом, на конкурс изобразительного искусства на ярмарке штата. В конце месяца он объявил, что одна из работ под названием Théâtre d'Opéra Spatial, получила главный приз в категории «Цифровое искусство» (Digital Arts/Digitally Manipulated Photography).

Нейросеть сгенерировала

Для создания своих художественных работ Аллен использовал Midjourney, коммерческую модель синтеза изображений, похожую на Stable Diffusion (но с собственным отличительным художественным стилем), которая работает через сервер на платформе Discord. Он напечатал три изображения на холсте и представил их на конкурс.

Декабрь: ChatGPT заговорил с миром

-9

В последний день ноября OpenAI анонсировала ChatGPT, чат-бота, основанного на крупной языковой модели GPT-3. OpenAI сделала его доступным бесплатно через свой сайт, чтобы собрать отзывы о том, как доработать модель для получения более точных результатов.

Через пять дней после запуска генеральный директор OpenAI Сэм Альтман написал в Твиттере, что ChatGPT охватил более 1 миллиона пользователей. Люди использовали его для решения задач по программированию, имитации сеанса работы с консолью Linux, создания рецептов, написания стихов и многого другого.

Подписаться на мой канал в Telegram здесь