Сегодня хочу рассказать про, пожалуй, самую известную и влиятельную компанию в области искусственного интеллекта — OpenAI. Она стоит за такими продуктами, как ChatGPT, DALL-E, OpenAI Codex. В этой статье расскажу про историю создания и развития OpenAI, про людей, работающих там и поддерживающих ее миссию и про достижения компании, а также про недавний скандал, связанный с увольнением и возвращением ее генерального директора Сэма Альтмана. Поехали!
Как все начиналось
OpenAI была основана в декабре 2015 года группой видных предпринимателей и ученых, среди которых были Илон Маск, Сэм Альтман, Питер Тиль, Рид Хоффман, Джессика Ливингстон. Они объявили, что пожертвуют более миллиарда долларов на создание некоммерческой организации, целью которой будет разработка «безопасного и полезного» искусственного общего интеллекта (AGI), то есть системы, которая сможет выполнять любую задачу. Они также заявили, что будут «свободно сотрудничать» с другими институтами и исследователями, делая свои патенты и исследования открытыми для общественности.
Основатели были мотивированы желанием предотвратить возможный сценарий, в котором искусственный интеллект станет угрозой для человечества, или в котором он будет контролироваться небольшой группой корпораций и государств. Они хотели создать AGI, который послужит всем людям. Как сказал Маск в одном из интервью: «Целью OpenAI является создание искусственного интеллекта, который мы можем использовать как расширение наших собственных возможностей, а не как замену нам».
В первые годы существования OpenAI сосредоточилась на исследовании различных аспектов ИИ: генеративные модели, обучение с подкреплением, нейронные сети, компьютерное зрение, естественный язык. Она также проводила эксперименты с роботами. Например, с роботической рукой, которая училась манипулировать разными предметами. Одним из самых известных проектов был OpenAI Five, команда из пяти нейросетей, которая научилась играть в компьютерную игру Dota 2 на профессиональном уровне и смогла победить лучших игроков в мире.
Переход к коммерции
В 2019 году OpenAI объявила о переходе к гибридной структуре, состоящей из некоммерческой организации OpenAI, Inc. и коммерческой дочерней компании OpenAI Global, LLC. Это было сделано для того, чтобы привлечь больше инвестиций и талантов, а также, чтобы конкурировать с другими крупными игроками в области искусственного интеллекта: Google, Facebook, Amazon и Microsoft. В то же время OpenAI сохранила свою миссию и обязательства по безопасности и открытости своих технологий.
Одним из главных партнеров и инвесторов OpenAI стала Microsoft, которая в июле 2019 года объявила о своем намерении вложить миллиард долларов в OpenAI. В 2022 году увеличила свою долю в OpenAI до 49%, став ее крупнейшим собственником. Microsoft также интегрировала технологии OpenAI в свои продукты, такие как Office, GitHub и Azure.
ChatGPT
В ноябре 2019 года OpenAI представила свой первый коммерческий продукт —ChatGPT, платформу для создания и использования генеративных моделей естественного языка. ChatGPT основана на GPT-3, одной из самых мощных и продвинутых моделей в области искусственного интеллекта, которая обучена на триллионах слов. ChatGPT может генерировать тексты по любой теме, отвечать на вопросы, вести диалоги, писать стихи, код, песни и многое другое. Проект стал популярнм среди разработчиков, исследователей, журналистов и обычных пользователей.
DALL-E
В январе 2020 года был представлен еще один продукт — DALL-E, система, создающая реалистичные изображения по описанию на естественном языке. Например, DALL-E может нарисовать «авокадо-стул», «собаку в костюме суши» или «башню из кирпичей на Луне». DALL-E также редактирует и комбинирует изображения, добавляет или убирает детали, менять цвета и стили. Она демонстрирует потрясающий уровень креативности и воображения.
Codex
В августе 2020 года компания представила решение для программирования Codex. Кодекс —система, которая генерирует и исполняет код по естественноязычному запросу. Например, Кодекс может написать программу, построить сайт или создать игру. Он основан на GPT-3, но специализируется на кодировании. Работает с разными языками программирования: Python, JavaScript, C#, Java и другие.
Примечательно что OpenAI Codex Playground, платформа для взаимодействия пользователей с нейросетью через веб-интерфейс, написана самим Кодексом.
Другим продуктом, основанным на Кодексе, является GitHub Copilot, совместный проект OpenAI и Microsoft, запущенный в июне 2020 года. GitHub Copilot помогает разработчикам писать код быстрее и лучше, предлагая подсказки и автозаполнение на основе Кодекса. GitHub Copilot работает с любым фреймворком, библиотекой или языком, а также учитывает существующий код и комментарии.
Whisper
Whisper – система для анализа, интерпретирования и улучшения текста была презентована в октябре 2021 года. Это не просто генератор текста, а интеллектуальный помощник, который может помогать в разных ситуациях, связанных с письмом и чтением.
Whisper может выполнять разные задачи, такие как:
- Проверка и исправление орфографии, грамматики, пунктуации и стиля текста
- Перевод текста с одного языка на другой, с учетом контекста и культуры
- Реферирование и суммирование текста, выделение ключевых идей и фактов
- Генерация заголовков, вступлений, заключений и переходов для текста
- Поиск и проверка источников, цитат и ссылок в тексте
- Анализ тона, настроения, эмоций и намерений автора и читателя текста
- Предложение синонимов, антонимов, определений и примеров для слов и фраз в тексте
- Создание и редактирование таблиц, графиков, диаграмм и изображений для текста
- Генерация вопросов и ответов по тексту, проверка понимания и запоминания текста
Whisper доступен через веб-интерфейс, мобильное приложение и браузерное расширение. Пользователи могут вводить текст, выбирать задачу, которую хотят выполнить, и видеть результаты в реальном времени.
GPT-4
GPT-4, представленный в марте 2023 года, стал первой моделью, которая принимает и выдает не только текст, но и изображения. Это значит, что GPT-4 может создавать и анализировать визуальный контент по описанию на естественном языке, а также вести диалоги с использованием изображений. Например, GPT-4 может нарисовать логотип по запросу пользователя, объяснить, что изображено на фотографии, или показать пользователю картинку, которая иллюстрирует его слова. Он также стал быстрее и точнее, чем GPT-3, благодаря улучшенной архитектуре и оптимизации.
GPT-5
GPT-5 —планируемая следующая версия GPT, о которой пока мало что известно. По некоторым слухам, она будет иметь еще больше параметров, чем GPT-4, и сможет обрабатывать и генерировать не только текст и изображения, но и аудио, видео и 3D-графику. Также предполагается, что GPT-5 будет способна к самостоятельному извлечению знаний из разных источников без предварительной разметки данных. Некоторые эксперты утверждают, что GPT-5 может стать первой моделью, которая достигнет искусственного общего интеллекта (AGI), то есть системы, выполняющую любую задачу.
Скандал с увольнением и возвращением Альтмана
В ноябре 2023 года OpenAI столкнулась с одним из самых серьезных кризисов в своей истории, связанным с увольнением генерального директора Сэма Альтмана. Альтман был одним из сооснователей и лидеров компании, и был ответственен за стратегию, финансирование и партнерства компании. Он также одним из самых известных и уважаемых лиц в области искусственного интеллекта, и часто выступает на разных конференциях и форумах.
Увольнение Альтмана было объявлено в пятницу, 17 ноября, в заявлении совета директоров, в котором говорилось, что Альтман «не был последовательно честен в своих коммуникациях» с советом. Совет не дал конкретных причин решения, но по некоторым источникам, это было связано с разногласиями по поводу направления и целей компании, а также с конфликтом интересов Альтмана, крупнейшим акционером Microsoft, главного партнера и инвестора OpenAI.
Увольнение Альтмана вызвало шок и недовольство среди сотрудников и сообщества, считающего его вдохновителем и лидером компании. Большинство сотрудников подписали петицию с требованием о восстановления Сэма и отставки совета директоров. Известные исследователи и разработчики OpenAI (Грег Брокман, Илья Суцкевер, Владимир Вапник), ушли из компании в знак протеста.
В понедельник, 20 ноября, Альтман объявил, что присоединяется к Microsoft в качестве главы новой лаборатории искусственного интеллекта. Он также заявил, что продолжает поддерживать миссию и ценности OpenAI, и что надеется на будущее взаимодействие с компанией. В то же время Microsoft наняла еще одного сооснователя и бывшего президента OpenAI. Microsoft также выразила свое намерение вложить еще два миллиарда долларов в OpenAI, увеличив долю в компании до 51%.
Во вторник, 21 ноября, произошел еще один неожиданный поворот событий. Совет директоров OpenAI объявил, что достиг соглашения с Альтманом о его возвращении на пост генерального директора OpenAI. Совет также объявил, что четыре из пяти его членов уходят в отставку, а на их место приходят новые лица: Брет Тейлор, бывший совместный генеральный директор Salesforce, Ларри Саммерс, бывший министр финансов США, и Адам Д’Анджело, генеральный директор Quora.
Альтман согласился вернуться в OpenAI и поблагодарил Microsoft за поддержку и сказал, что будет продолжать работать с ней в рамках партнерства. Он выразил свою радость по поводу возвращения в OpenAI и сказал, что у компании есть большие планы и перспективы на будущее.
Планы компании на будущее
OpenAI ставит перед собой амбициозную миссию: создать и обеспечить безопасность и доступность искусственного интеллекта. У компании глобальные планы на будущее:
- Улучшение и расширение платформы ChatGPT. Компания планирует добавить новые функции и возможности к ChatGPT: голосовой ввод и вывод, память для истории диалога, интеграция с другими приложениями и сервисами, а также улучшение качества и безопасности диалогов.
- Создание и предоставление API для настройки и дообучения моделей GPT с помощью собственных данных пользователей. Это позволит пользователям создавать собственные модели, которые будут адаптированы к специфическим целям и потребностям. Компания планирует предоставить инструменты и ресурсы для обучения и поддержки пользователей в процессе настройки и дообучения моделей.
- Разработка и внедрение системы для автоматической оценки и контроля качества и безопасности моделей GPT. Это включает в себя создание и использование разных метрик, тестов, бенчмарков и сценариев, которые будут проверять модели на точность, фактичность, согласованность, смысловая целостность, этичность, справедливость.
OpenAI —одна из самых уникальных и важных компаний в области искусственного интеллекта, создающая продукты, меняющие мир. Надеюсь, что эта статья была полезной и интересной для, и вы захотите подписаться на канал. Спасибо за внимание!