2022-й был довольно интересным для искусственного интеллекта (ИИ). Он научился создавать впечатляющие изображения по текстовому описанию, а также текст и музыку. В этой небольшой заметке 6 самых главных событий.
Апрель: фантазии DALL-E 2 в картинках
В апреле OpenAI анонсировала DALL-E 2 — обучаемую модель для синтеза изображения, которая способна создавать картинки по текстовому описанию. Она была обучена на сотнях миллионов изображений из открытого доступа.
Буквально после этого соцсети наводнили изображения, которые впечатляли своей реалистичностью — все они были созданы нейросетью. В конце сентября DALL-E 2 стала доступна для всех желающих.
Июль: инженер из Google считает нейросеть LaMDA разумной
В начале июля газета Washington Post сообщила, что инженер Google по имени Блейк Лемуан был отправлен в оплачиваемый отпуск в связи с его убеждением, что разработанная Google языковая модель LaMDA — разумна и заслуживает прав человека.
Работая в составе организации Google Responsible AI, Лемуан начал общаться с LaMDA о религии и философии и поверил, что видит за текстом настоящий интеллект. По словам Google, LaMDA говорила Лемуану только то, что он хотел услышать, и она на самом деле не является разумной. Как и инструмент генерации текста GPT-3, LaMDA ранее был обучена на миллионах книг и веб-сайтов.
Попутно Лемуан якобы нарушил политику конфиденциальности Google, рассказав о работе своей группы. Позже, в июле, Google уволила Лемуана за нарушение политики безопасности данных.
Июль: DeepMind AlphaFold предсказывает почти все известные структуры белков
В июле компания DeepMind объявила, что их ИИ AlphaFold предсказал форму почти всех известных белков, которые входят в состав большинства организмов на Земле с секвенированным геномом. Изначально анонсированная летом 2021 года, AlphaFold ранее предсказала форму всех человеческих белков. Но уже через год ее база данных расширилась и теперь содержит более 200 миллионов белковых структур.
DeepMind разместила предсказанные структуры белков в общедоступной базе данных Европейского института биоинформатики при Европейской лаборатории молекулярной биологии (EMBL-EBI), что позволяет исследователям со всего мира получить к ним доступ и использовать для исследований, связанных с медициной и биологическими науками.
Белки — это основные строительные блоки жизни, и знание их формы может помочь ученым контролировать или изменять их. Это особенно полезно при разработке новых лекарств.
Август: Stable Diffusion открывает код
Компании Stability AI и CompVis 22 августа выпустили Stable Diffusion 1.4 — модель для синтеза изображений, аналог DALL-E 2 от OpenAI. DALL-E 2 — закрытая модель со значительными ограничениями, а исходный код Stable Diffusion открыт. Также пользователи могут использовать её локально и конфиденциально на своих ПК с мощной графикой.
Энтузиасты тепло приняли открытый код Stable Diffusion и создали вокруг него экосистему. Таким образом появились интеграции нейросети в различные продукты (сайты и приложения). Сейчас уже актуальна версия Stable Diffusion под номером 2.1.
Август: изображение, созданное искусственным интеллектом, получает первую награду
В начале августа житель Колорадо (США) по имени Джейсон Аллен представил три изображения, сгенерированные искусственным интеллектом, на конкурс изобразительного искусства на ярмарке штата. В конце месяца он объявил, что одна из работ под названием Théâtre d'Opéra Spatial, получила главный приз в категории «Цифровое искусство» (Digital Arts/Digitally Manipulated Photography).
Для создания своих художественных работ Аллен использовал Midjourney, коммерческую модель синтеза изображений, похожую на Stable Diffusion (но с собственным отличительным художественным стилем), которая работает через сервер на платформе Discord. Он напечатал три изображения на холсте и представил их на конкурс.
Декабрь: ChatGPT заговорил с миром
В последний день ноября OpenAI анонсировала ChatGPT, чат-бота, основанного на крупной языковой модели GPT-3. OpenAI сделала его доступным бесплатно через свой сайт, чтобы собрать отзывы о том, как доработать модель для получения более точных результатов.
Через пять дней после запуска генеральный директор OpenAI Сэм Альтман написал в Твиттере, что ChatGPT охватил более 1 миллиона пользователей. Люди использовали его для решения задач по программированию, имитации сеанса работы с консолью Linux, создания рецептов, написания стихов и многого другого.