Мир технологий ожидает значительных изменений с выходом новой версии искусственного интеллекта от OpenAI — GPT-5. Главный технический директор компании Мира Мурати прогнозирует, что к концу 2025 или началу 2026 года ChatGPT-5 достигнет уровня интеллекта, сравнимого с доктором философии в определённых задачах. Этот уровень интеллекта будет значительным скачком по сравнению с его предшественником — GPT-4, который был выпущен в прошлом году.
GPT-4o: новый стандарт взаимодействия
Важным промежуточным шагом к GPT-5 стал выпуск 13 мая 2024 года модели GPT-4o. Эта модель сделала значительный шаг к более естественному взаимодействию человека с компьютером. GPT-4o принимает любую комбинацию текста, аудио, изображения и видео в качестве входных данных и генерирует любую комбинацию текстовых, аудио и графических выходных данных. Модель способна реагировать на аудиовходы всего за 232 миллисекунды, в среднем за 320 миллисекунд, что аналогично времени отклика человека в разговоре.
GPT-4o соответствует производительности GPT-4 Turbo на тексте на английском языке и коде, но также значительно улучшает работу с текстами на неанглийских языках. Она работает намного быстрее и на 50% дешевле в API. Особенно GPT-4o лучше понимает зрение и звук по сравнению с предыдущими моделями, что делает её важным шагом в развитии ИИ.
До появления GPT-4o вы могли использовать голосовой режим для разговора с ChatGPT с задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Этот голосовой режим представлял собой конвейер из трёх отдельных моделей: одна модель транскрибировала аудио в текст, GPT-3.5 или GPT-4 принимали текст и выводили текст, а третья модель преобразовывала этот текст обратно в аудио. Такой процесс означал, что основной источник интеллекта, GPT-4, терял много информации — он не мог непосредственно наблюдать за тоном, несколькими динамиками или фоновыми шумами, и не мог выдавать смех, петь или выражать эмоции.
С помощью GPT-4o OpenAI обучила единую новую модель от конца до конца для обработки текста, зрения и аудио, что означает, что все входы и выходы обрабатываются одной и той же нейронной сетью. Поскольку GPT-4o является первой моделью, сочетающей в себе все эти методы, компания всё ещё только начинает изучать, на что способна модель и какие у неё ограничения.
Особенности и ожидания от GPT-5
GPT-5, также известный под кодовыми названиями «Gobi» и «Arrakis», будет мультимодальной моделью с около 52 триллионами параметров. Этот значительный прирост параметров указывает на огромные возможности для улучшения точности и эффективности модели. Генеральный директор OpenAI Сэм Альтман отметил, что хотя первоначально планировался выпуск в 2023 году, фиксированных сроков нет, и название модели может измениться.
Большой скачок возможностей ИИ
Прогресс от GPT-4 к GPT-5 можно сравнить с переходом от средней школы к университетскому уровню понимания. Это подчёркивает значительное улучшение изысканности и возможностей модели.
Мира Мурати недавно обсуждала эти достижения на Dartmouth Engineering. Она подчеркнула трансформационный потенциал GPT-5 и его способность сдавать сложные экзамены. Кевин Скотт из Microsoft на автосалоне Berggruen в 2024 году также отметил потенциал GPT-5 для решения сложных задач, намекая на его улучшенные способности к рассуждениям и решению проблем.
Ожидается, что эта система ИИ следующего поколения снизит барьеры для вхождения в ИИ, сделав мощные инструменты более доступными.
Сроки и ожидания
Разработка ChatGPT-5 началась в декабре 2023 года. Публичный выпуск планируется после выборов в США в 2024 году, хотя конкретные сроки остаются неопределёнными.
Алан Д. Томпсон, эксперт по искусственному интеллекту, изначально предсказывал выпуск в декабре 2024 года. Однако недавние обновления предполагают выпуск ближе к концу 2025 года или началу 2026 года. Этот расширенный временной график позволяет OpenAI гарантировать качество и мощность системы.
Мира Мурати подчеркнула, что высокая производительность ChatGPT-5 будет специфична для задач. Современные системы ИИ уже демонстрируют способности на уровне человека в некоторых областях, и GPT-5 стремится ещё больше расширить эти возможности.
Подготовка к будущему ИИ
Мира Мурати также выделила важность интеграции мер безопасности с технологическими достижениями. Она упомянула, что будущие системы ИИ будут иметь агентные возможности, что позволит им беспрепятственно сотрудничать между ИИ и людьми. Для этого сотрудничества потребуются встроенные защитные ограждения для эффективного управления интеллектуальными системами.
Я уверен, что развитие ИИ GPT-5 — это важный и необходимый шаг вперед. В эпоху быстрого технологического прогресса важно не только идти в ногу со временем, но и предвидеть будущее. GPT-5 может улучшить существующие системы и создать новые сферы применения. Он может стать ценным инструментом для ученых, инженеров и обычных пользователей для решения сложных задач с большей эффективностью. Однако мы не должны забывать о рисках. Развитие мощных систем ИИ требует особого внимания к вопросам безопасности и этики. Важно, чтобы эти системы служили человечеству и не представляли угрозы. В этом контексте усилия OpenAI по внедрению мер безопасности и разработке этических норм — важный шаг на пути к безопасному и ответственному использованию GPT-5.
Ключевые выводы
- Разведка на уровне доктора философии: GPT-5 стремится достичь продвинутых интеллектуальных уровней в конкретных задачах к концу 2025 года или началу 2026 года.
- Значительная прогрессия: Это значительный скачок в возможностях ИИ от средней школы до университетского уровня понимания.
- Нет фиксированной временной шкалы: Хотя первоначально предполагалось в 2023 году, выпуск GPT-5 был отложен для обеспечения качества и мощности.
- Мультимодальная модель: Модель будет иметь 52 триллиона параметров, улучшая рассуждения и способность к решению проблем.
- Меры безопасности: Интеграция мер безопасности с разработкой ИИ имеет решающее значение для будущего сотрудничества между ИИ и людьми.
GPT-5 обещает стать значительным шагом вперёд в развитии искусственного интеллекта, предлагая новые возможности и инструменты для использования в различных сферах. Мы на пороге новой эры, и важно подготовиться к ней, используя весь потенциал новых технологий.