Интервью Мустафа Сулеймана, основателя DeepMind и Anthropic, партнеру венчурного фонда Greylock Partners Сету Розенбергу.
🟡 Основание DeepMind: визонернерский и противоречивый путь
Сулейман начал с рассказа о происхождении DeepMind в 2010 году, подчеркнув, насколько нетрадиционной казалась их миссия в то время.
«Трудно переоценить, насколько странными мы были... люди не просто считали это невозможным; они считали это полным абсурдом".
С самого начала был фокус не только на ИИ, но и на создании системы с AGI, способной превзойти человеческие знания и способности во всех областях. Эта амбициозная цель была обусловлена желанием применить ИИ для решения сложных глобальных проблем, и они считали, что это начинание не может быть адекватно реализовано в рамках ограничений академических или государственных учреждений.
«На самом деле, только стартапы были настолько смелыми и отважными... насколько это было необходимо для успеха этой миссии».
🟡 Определение и измерение интеллекта
Сулейман объяснил, что один из соучредителей DeepMind, Шейн Легг, посвятил свою докторскую диссертацию исследованию различных определений интеллекта, в конечном итоге определив его как «способность хорошо работать во многих сферах». Этот акцент на общности стал центральным в их работе, хотя, как отметил Сулейман, «широкая применимость является одной из характеристик интеллекта, но это не единственная важная характеристика». Он также обсудил тест Тьюринга, традиционный способ измерения интеллекта, отметив, что, хотя ИИ добился значительных успехов в области разговорных способностей, это не обязательно равнозначно истинному интеллекту.
«Каждый раз, когда мы превосходим бенчмарк... вы как бы разворачиваетесь и говорите: «Хорошо, но на самом деле есть много проблем с этим бенчмарком».
🟡 Будущее ИИ: специализированные системы против обобщенного интеллекта
Сулейман дал представление о будущей траектории ИИ, в частности о балансе между специализированными системами ИИ и обобщенным интеллектом. Он предположил, что в ближайшем будущем мы, скорее всего, увидим мощные системы ИИ, специализированные для конкретных задач, а не одну систему, способную выполнять широкий спектр функций.
«Я думаю, что более вероятно, что у нас будут действительно мощные системы, специализированные для конкретных вариантов использования... чем у нас будет такая очень универсальная система»
Сулейман также предложил современный тест Тьюринга, основанный на практических возможностях, таких как способность генерировать прибыль посредством автономной деловой активности, предсказав, что такая система может быть создана к 2030 году.
🟡 Достижения в области ИИ: роль данных и обучения с подкреплением
Хотя большие модели, такие как GPT-4, привлекли большое внимание, будущее ИИ может включать в себя более мелкие, более эффективные модели. «В истории всех ценных технологий все, что является значительным, со временем становится дешевле и проще в использовании», — сказал он, предсказав, что модели с открытым исходным кодом вскоре будут конкурировать с частными закрытыми моделями по производительности.
Более того, Сулейман подчеркнул переход к обучению с подкреплением на основе обратной связи ИИ, где сами модели ИИ помогают генерировать данные для обучения, повышая эффективность и снижая зависимость от данных, созданных человеком. Высококачественные данные, а не просто большие объемы вычислений, становятся самым ценным активом в разработке ИИ. Этот сдвиг открывает стартапам возможности для инноваций путем создания уникальных наборов данных, адаптированных к конкретным областям, тем самым улучшая тонкую настройку моделей для конкретных приложений.
“Если вы создадите модель, которая будет тут же учиться на обратной связи от пользователей, то она может обучиться до недосягаемого для других уровня”.
🟡 Будущее ИИ: автономные агенты и этические соображения
Сулейман коснулся потенциала и рисков автономных агентов ИИ. Признав впечатляющие возможности текущих моделей, он предостерег от продвижения полностью автономных систем, сославшись на потенциальные опасности.
«Я не думаю, что мы находимся на пути к полной автономии, и я думаю, что это на самом деле весьма нежелательно»
Сулейман также предсказал, что достижение надежных, ориентированных на действия систем ИИ, которые могут выполнять сложные задачи автономно, потребует значительно большей вычислительной мощности и уточнения данных, оценив, что этот уровень сложности может быть не реализован, пока модели не достигнут масштаба GPT-6.
Оригинал
https://www.youtube.com/watch?v=cNzRviY4Ei8