1 подписчик

Илья Суцкевер. Безопасный суперинтеллект. Что строит сейчас создатель ChatGPT

22 марта22 мар

13 мин

Roman Romanov Если вы следите за миром искусственного интеллекта, имя Ильи Суцкевера встречается постоянно. Его называют «архитектором современных нейросетей», «гением, стоящим за ChatGPT» и даже «отцом глубокого обучения».

Но так ли это на самом деле? Давайте разберёмся, кто такой Илья Суцкевер: что он создал, что позаимствовал у других, на чьи работы опирается и почему его новый проект Safe Superintelligence (SSI) может как перевернуть мир ИИ, так и провалиться. Илья Ефимович Суцкевер родился 8 декабря 1986 года в городе Горький (СССР) в семье инженера Ефима Суцкевера, выпускника физического факультета Горьковского государственного университета. Когда ему было пять лет, семья репатриировалась в Израиль и поселилась в Иерусалиме, а когда Илье исполнилось 16 — переехала в Канаду. Интересно, что интерес к искусственному интеллекту у него проявился ещё в детстве. По словам родителей, он начал рассуждать об ИИ в совсем юном возрасте. В 2003 году, будучи второкурсником Университета Торонт

Оглавление

👨‍🎓 Путь учёного: от Горького до Кремниевой долины
Детство и первые шаги
Встреча с Джеффри Хинтоном, которая определила всё

Roman Romanov

Если вы следите за миром искусственного интеллекта, имя Ильи Суцкевера встречается постоянно. Его называют «архитектором современных нейросетей», «гением, стоящим за ChatGPT» и даже «отцом глубокого обучения».
Но так ли это на самом деле?

Давайте разберёмся, кто такой Илья Суцкевер: что он создал, что позаимствовал у других, на чьи работы опирается и почему его новый проект Safe Superintelligence (SSI) может как перевернуть мир ИИ, так и провалиться.

👨‍🎓 Путь учёного: от Горького до Кремниевой долины

Детство и первые шаги

Илья Ефимович Суцкевер родился 8 декабря 1986 года в городе Горький (СССР) в семье инженера Ефима Суцкевера, выпускника физического факультета Горьковского государственного университета. Когда ему было пять лет, семья репатриировалась в Израиль и поселилась в Иерусалиме, а когда Илье исполнилось 16 — переехала в Канаду.

Интересно, что интерес к искусственному интеллекту у него проявился ещё в детстве. По словам родителей, он начал рассуждать об ИИ в совсем юном возрасте.

Встреча с Джеффри Хинтоном, которая определила всё

В 2003 году, будучи второкурсником Университета Торонто, Суцкевер спросил у руководителя бакалавриата по математике, есть ли в университете исследовательские проекты в области машинного обучения. Ему рекомендовали поговорить с профессором Джеффри Хинтоном.

Это знакомство стало судьбоносным. Хинтон, которого сегодня называют «крёстным отцом глубокого обучения», разглядел в молодом студенте редкий талант. Первым заданием Ильи было улучшить алгоритм машинного обучения для визуализации данных (Стохастическое соседнее вложение), который разработал сам Хинтон. Суцкевер блестяще справился.

«Благодаря сотрудничеству с Хинтоном у Ильи появилась возможность работать над одними из самых важных научных проблем нашего времени и развивать идеи, которые в то время были крайне недооценены большинством учёных, но оказались совершенно правильными».

В 2005 году Суцкевер получил степень бакалавра по математике и компьютерным наукам, в 2007-м — магистерскую, а в 2012–2013 годах — докторскую степень (PhD) под руководством Хинтона. Его диссертация называлась «Обучение рекуррентных нейронных сетей».

🧠 Ключевые достижения: что создал именно Илья

1️⃣ Ранняя работа по генерации текста (2011)

Ещё до OpenAI, работая в Университете Торонто, Суцкевер опубликовал с Хинтоном и Мартенсом статью «Генерация текста с помощью рекуррентных нейронных сетей» (ICML 2011). В ней они обучили рекуррентную сеть предсказывать следующий символ на 16 миллионах статей из Википедии.
Это был один из первых примеров того, как нейросеть учится внутреннему представлению языка без явного программирования правил.

2️⃣ AlexNet (2012) — революция в компьютерном зрении

Это главный прорыв, с которого началась эра глубокого обучения.

В 2012 году Суцкевер вместе с сокурсником Алексом Крижевским и научным руководителем Джеффри Хинтоном разработал AlexNet — глубокую свёрточную нейронную сеть, которая произвела фурор на конкурсе ImageNet.

Что они сделали:

Использовали графические процессоры (GPU) для обучения нейросети — до них почти никто так не делал.
Обучили сеть с 60 миллионами параметров на 1,3 миллиона изображений. Тренировка заняла пять-шесть дней.
Снизили ошибку классификации с 25% (лучший предыдущий результат) до 15,3% (top-5 error), выиграв конкурс с отрывом более чем в 10%.

Значение: AlexNet доказала, что глубокое обучение работает, и запустила лавину исследований, которая привела к современному ИИ.

«Это была первая работа, которая популяризировала в компьютерном зрении свёрточные нейронные сети, разработанные Яном Лекуном ещё в 1989 году. AlexNet положила начало революции в области ИИ».

3️⃣ DNNresearch и переход в Google (2013)

В 2012 году Хинтон, Крижевский и Суцкевер основали компанию DNNresearch. В марте 2013 года Google приобрёл этот стартап. По разным оценкам, сумма сделки составила около $44 млн. Все трое перешли в Google, где Илья присоединился к команде Google Brain.

4️⃣ Sequence-to-Sequence (Seq2Seq, 2014) — основа машинного перевода

В Google Brain Суцкевер вместе с Ориолом Виньялсом и Куоком Ле разработал метод «Обучение с преобразованием последовательности в последовательность».

Что это дало:

Модель, которая принимает на вход последовательность элементов (например, слов на английском) и возвращает другую последовательность (перевод на французский).
Впервые нейросеть научилась учитывать контекст при переводе, а не просто заменять слова по словарю.
Это произвело революцию в машинном переводе и легло в основу обновлённого Google Translate.

До этой работы многие исследователи не верили, что нейронные сети вообще способны переводить текст. Результаты стали для них полной неожиданностью.

5️⃣ AlphaGo (2016) — нейросети учатся интуиции

Менее известный факт: Суцкевер внёс вклад и в создание AlphaGo — системы, обыгравшей чемпиона мира по игре Го Ли Седоля.

В интервью Pieter Abbeel он рассказывал, что его стажёр Крис Мэддисон работал над применением свёрточных сетей к игре го. Когда DeepMind (которую к тому моменту купил Google) узнала об этом, они объединили усилия. AlphaGo стала первым примером того, как нейросети осваивают игру, требующую не просто просчёта, а интуиции и креативности.

6️⃣ GPT и ChatGPT (2018–2023) — языковые модели

Как сооснователь и главный научный сотрудник OpenAI (с 2015 года), Суцкевер руководил разработкой всех моделей GPT: от первой версии до GPT-4.

Он лично возглавлял проект ChatGPT, запущенный в ноябре 2022 года. В 2023 году он также объявил о создании направления Superalignment, целью которого было обеспечить безопасность будущего суперинтеллекта.

❓ Важное разъяснение: является ли он «прародителем» нейросетей?

Нет. Илья Суцкевер — гениальный инженер и исследователь, который довёл чужие идеи до масштаба, изменившего мир. Но фундаментальные концепции нейросетей были заложены задолго до него.

Что сделал Суцкевер:

Он взял свёрточные сети (изобретение Лекуна в 1989 году) и впервые применил их с GPU в масштабе, который доказал эффективность глубокого обучения.
Он взял идею предсказания следующего слова (существовавшую десятилетиями) и реализовал её на рекуррентных сетях так хорошо, что это легло в основу всех чат-ботов.
Он взял архитектуру трансформера (изобретение восьми исследователей Google в 2017 году) и масштабировал её до GPT-4.

Честная оценка

Суцкевер — не изобретатель нейросетей, а их величайший масштабировщик и интегратор. Его гений — в умении увидеть, какая идея сработает, если её увеличить до невероятных размеров, и в способности довести эту идею до реализации.

Сам Хинтон однажды прокомментировал вклад каждого из трёх соавторов AlexNet так:

«Илья считал, что нам стоит это сделать, Алекс заставил это работать, а я получил Нобелевскую премию»
(имея в виду премию Тьюринга, которую Хинтон получил в 2018 году).

🚀 Что сейчас происходит с Суцкевером: Safe Superintelligence (SSI)

Уход из OpenAI (2024)

В ноябре 2023 года Илья, входивший в совет директоров OpenAI, принял участие в голосовании за увольнение Сэма Альтмана. Конфликт касался скорости коммерциализации и безопасности. Через пять дней, после того как 700 из 770 сотрудников выступили в поддержку Альтмана, он вернулся, а Илья оставался в компании ещё несколько месяцев, формально занимаясь проектом Superalignment.
15 мая 2024 года Суцкевер объявил об уходе из OpenAI.

Основание SSI (июнь 2024)

19 июня 2024 года Суцкевер вместе с Даниэлем Гроссом (бывшим техническим директором OpenAI) и Дэниелом Леви объявил о запуске Safe Superintelligence Inc. (SSI).

Главное отличие от OpenAI, Anthropic, Google и других игроков — SSI с самого начала позиционирует себя как компанию, которая не будет выпускать промежуточные продукты. Ни чат-ботов, ни API, ни коммерческих моделей для бизнеса. Единственная цель — создать безопасный суперинтеллект (ASI), который превзойдёт человека по всем видам интеллектуальной деятельности, но при этом будет абсолютно надёжным.

Слоган компании, который Илья повторяет в редких интервью:

«Наша единственная миссия — безопасный суперинтеллект. Никаких отвлечений на промежуточные задачи».

Чем ещё Safe Superintelligence отличается от того, что мы имеем сейчас?

Сегодняшние модели (ChatGPT, Claude, Gemini) — это узкие интеллекты. Они блестяще предсказывают следующее слово, пишут код и отвечают на вопросы, но делают это за счёт гигантского объёма «вызубренных» данных. Как говорит сам Суцкевер: *«Они как студенты, которые 10 000 часов готовились к олимпиаде по программированию: идеально решают олимпиадные задачи, но теряются, когда нужно справиться с чем-то новым»*.

Вот главные отличия:

Современные большие языковые модели обучаются на миллионах примеров, а настоящий интеллект учится с нескольких — как человек. Сегодняшние нейросети не имеют устойчивого понимания причинно-следственных связей, а суперинтеллект будет понимать физику, логику и причинность. У нынешних моделей «неровные» способности (это называют jaggedness): они блестяще решают одни задачи и проваливаются на смежных. Суперинтеллект же будет универсально силён во всех областях.

Кроме того, современные модели не могут самостоятельно ставить и решать новые научные задачи — они лишь комбинируют то, что уже есть в данных. Суперинтеллект, по замыслу, сможет вести автономные исследования, совершать открытия и даже изобретать. И наконец, безопасность сегодня добавляется к уже готовой модели «заплатками» (RLHF, фильтры). В проекте Суцкевера безопасность должна быть встроена в саму архитектуру с самого начала.

Суцкевер хочет перейти от «умного автодополнения» к настоящему агентному интеллекту — системе, которая не просто отвечает на вопросы, а сама планирует, действует, учится на своём опыте и делает это надёжно.

Именно ради этого он бросил OpenAI. В его понимании, продолжать наращивать масштаб существующих моделей — тупик. Нужен принципиально новый подход, который займёт 5–20 лет, но приведёт к созданию разума, способного решать проблемы, неподвластные человечеству: от победы над старением до освоения других планет.

Инвестиции и оценка

Июнь 2024 — основание компании SSI.
Сентябрь 2024 — привлечение $1 млрд при оценке $5 млрд.
Апрель 2025 — ещё $2 млрд, оценка выросла до $32 млрд.
В июле 2025 года появилась информация, что Meta предлагала купить SSI за $32 млрд, но получила отказ.

Кадровые изменения (июль 2025)

В июле 2025 года сооснователь и CEO Даниэль Гросс покинул SSI и перешёл в Meta (на должность руководителя по фундаментальным исследованиям ИИ). Илья сам занял кресло CEO, сосредоточив в своих руках и научное, и административное руководство. На тот момент в компании работало от 20 до 50 человек.

⚠️ Почему у Суцкевера может НЕ ПОЛУЧИТЬСЯ с SSI

1. ASI — это принципиально иная сложность

Суцкевер ставит перед собой задачу создать не просто лучшую языковую модель, а безопасный суперинтеллект (ASI) — систему, которая превосходит человека во всех видах интеллектуальной деятельности. Это задача, которую многие считают нерешаемой в обозримом будущем.

Сам он называет горизонт «от 5 до 20 лет». Такой разброс показывает, что даже он не уверен в успехе.

2. Он отказался от «Scaling Law», которая принесла ему успех

Парадокс: Суцкевер стал знаменит именно благодаря вере в масштабирование. Теперь он заявляет, что эпоха масштабирования закончилась и индустрия должна вернуться в «исследовательский режим»:

«С 2012 по 2020 год было исследовательское время. С 2020 по 2025 — время масштабирования. Теперь мы снова вернулись в исследовательское время. Мы действительно верим, что если увеличить масштаб в 100 раз, всё кардинально изменится? Я так не думаю».

Это означает, что он отказывается от проверенной стратегии в пользу неизведанного пути.

3. Отсутствие промежуточных продуктов — рискованная ставка

SSI не выпускает промежуточные версии, чат-ботов или API. Их первый и единственный продукт — это безопасный суперинтеллект. Это значит:

Никакого дохода в ближайшие годы (возможно, десятилетия)
Никакой обратной связи от реальных пользователей
Инвесторы могут потерять терпение

4. Конкуренты не стоят на месте

OpenAI, Anthropic, Google и Meta продолжают вкладывать десятки миллиардов долларов в масштабирование и продуктовую разработку. Даже если масштабирование «подошло к концу», инкрементальные (постепенные, небольшие) улучшения текущих моделей могут оказаться достаточно хорошими для рынка.

5. Кадровые изменения

Уход Даниэля Гросса в июле 2025 года — тревожный сигнал. Любое изменение в ключевой команде на ранней стадии может повлиять на темпы разработки.

✅ Почему у Суцкевера может ПОЛУЧИТЬСЯ

1. У него есть «чутьё»

В интервью 2025 года Суцкевера спросили, как он выбирает направления для исследований. Его ответ:

«Направления с потенциалом обычно выглядят элегантно и получают правильное вдохновение от биологического интеллекта. Если метод выглядит „уродливо“, это обычно предвещает проблемы».

Это редкое качество. Суцкевер уже доказал его, когда никто не верил в глубокое обучение, в GPU для нейросетей и в масштабирование языковых моделей.

2. История на его стороне

Все крупные прорывы в ИИ происходили не в гигантских корпоративных лабораториях:

AlexNet был обучен на двух GPU, купленных студентами за свой счёт.
Трансформер был разработан восемью исследователями Google на восьми GPU P100 (фактически «каждый принёс свою карту»).

Суцкевер убеждён:

«Когда теория верна, требуемые вычислительные ресурсы управляемы. Когда теория неверна, никакие ресурсы не помогут».

3. $32 млрд и свобода от «крысиных бегов»

SSI привлекла миллиарды и при этом не тратит деньги на:

обслуживание миллионов бесплатных пользователей
маркетинг
продуктовую разработку
инфраструктуру для вывода моделей (inference)

Суцкевер называет гонку современных ИИ-компаний «крысиными бегами» (rat race) и не хочет в них участвовать.

4. Он мыслит глубже конкурентов

Суцкевер видит фундаментальную проблему современных моделей — «jaggedness» (неровность способностей). Модель может блестяще решать одни задачи и проваливаться на смежных, потому что её способность к обобщению (generalization) гораздо слабее человеческой.

Он ищет способы создать модель, которая будет учиться как человек: с минимальным количеством примеров и способностью переносить знания между задачами.

5. Он не один — команда и наставники

За спиной Суцкевера стоят:

Джеффри Хинтон — его учитель, который публично поддержал его подход к безопасности ИИ
Дэниел Леви — сооснователь SSI, бывший исследователь OpenAI
Команда топ-исследователей, работающих в режиме строжайшей секретности

🎙 Главное интервью 2025 года: о чём говорил Илья

В ноябре 2025 года Суцкевер дал первое большое интервью после ухода из OpenAI. Это интервью разошлось на цитаты по всему ИИ-сообществу.

Ключевые тезисы:

Оценки и реальность — модели блестяще сдают тесты, но в реальных задачах могут бесконечно ходить по кругу (пример с двумя багами, которые модель «чинит» по очереди).
Два типа студентов — современные модели похожи на студента, который 10 000 часов готовился к олимпиаде по программированию и отлично решает олимпиадные задачи, но не умеет ничего другого. Настоящий интеллект — это способность быстро учиться новому с минимальными примерами.
Эмоции как «функция ценности» — Илья рассказал о пациентах с повреждением эмоциональных центров мозга: их интеллект формально сохранён, но они не могут принять даже простейшее решение (какие носки надеть). Эмоции — это не «слабость», а механизм, который позволяет нам оценивать промежуточные результаты. Без него обучение невозможно.
Возвращение в исследовательскую эпоху — фраза, которая стала заголовком всех новостей: «Мы вернулись в исследовательское время».
Критика «крысиных бегов» — Илья раскритиковал ситуацию, когда «идей меньше, чем компаний», а рынок наводнён стартапами, которые переупаковывают одни и те же технологии без фундаментальных открытий.

🎯 Заключение: гений или безумец?

Илья Суцкевер — фигура уникальная. Он не был «отцом нейросетей», но он стал тем, кто доказал их мощь миру. Он не изобрёл трансформер, но он масштабировал его до размеров, которые изменили человечество. Он не придумал deep learning, но он был главным инженером его триумфального шествия.

Сейчас он делает самую рискованную ставку в своей карьере: отказаться от гонки за быстрыми результатами и попытаться создать нечто, что может оказаться либо величайшим достижением человечества, либо самым дорогим провалом в истории ИИ.

*«Мне не интересно делать что-то, что немного лучше GPT-4, — говорит Суцкевер. — Я хочу сделать то, что действительно изменит мир — и сделать это правильно».*

Удастся ли ему? Возможно, мы узнаем об этом через 5, 10 или 20 лет. А возможно, не узнаем никогда. Но одно можно сказать точно: за Ильёй Суцкевером наблюдает весь мир, и его путь — это попытка прыгнуть выше головы, опираясь на фундамент, заложенный великими учёными прошлого.