94 подписчика

Кто оценит интеллект?

2 марта2 мар

3 мин

Соглашение OpenAI и Microsoft установило независимую проверку главного технологического рубежа, и это меняет всё. Представь, что ты покупаешь квартиру. Продавец говорит: "Всё готово, подписывай". Но есть независимый оценщик, который должен это подтвердить - иначе сделка не состоится. Примерно так работает новый механизм, который OpenAI и Microsoft встроили в своё партнёрское соглашение. Только вместо квартиры - момент появления искусственного общего интеллекта, и ставки несравнимо выше. Это система, которая превосходит человека в 95 процентах интеллектуальных задач: от сложных научных расчётов до этических дилемм, от написания кода до постановки медицинского диагноза. Раньше именно OpenAI мог сам объявить о достижении этого рубежа - и партнёрство с Microsoft автоматически меняло условия. Понятно, что это создавало почву для напряжения: а вдруг объявят раньше времени? Теперь такой вариант исключён. Независимая панель из 12-15 ведущих мировых экспертов по безопасности ИИ будет проверять

Оглавление

AGI - это не просто умный чат-бот
Критерии конкретные и измеримые
Для чего это нам?

Соглашение OpenAI и Microsoft установило независимую проверку главного технологического рубежа, и это меняет всё.

Представь, что ты покупаешь квартиру. Продавец говорит: "Всё готово, подписывай". Но есть независимый оценщик, который должен это подтвердить - иначе сделка не состоится. Примерно так работает новый механизм, который OpenAI и Microsoft встроили в своё партнёрское соглашение. Только вместо квартиры - момент появления искусственного общего интеллекта, и ставки несравнимо выше.

AGI - это не просто умный чат-бот

Это система, которая превосходит человека в 95 процентах интеллектуальных задач: от сложных научных расчётов до этических дилемм, от написания кода до постановки медицинского диагноза. Раньше именно OpenAI мог сам объявить о достижении этого рубежа - и партнёрство с Microsoft автоматически меняло условия. Понятно, что это создавало почву для напряжения: а вдруг объявят раньше времени? Теперь такой вариант исключён. Независимая панель из 12-15 ведущих мировых экспертов по безопасности ИИ будет проверять каждое такое заявление в течение 6-12 месяцев по строгим критериям.

Критерии конкретные и измеримые

Тест ARC-AGI система должна пройти с точностью выше 90 процентов. Проверка включает более тысячи реальных сценариев - от научных задач до этических головоломок. Проводится красное тестирование на десяти тысячах враждебных запросов, при этом процент "утечек" должен быть ниже 0,1 процента. Вероятность ложного срабатывания снижается до 1 процента. Эксперты дополнительно проверяют данные для обучения на предвзятость и качество согласования системы с человеческими ценностями. По оценкам компании Anthropic, подобный подход снижает риски некорректного поведения систем на 70 процентов.

Для чего это нам?

Честно говоря, обычному человеку эти проценты могут казаться абстракцией. Но вот что это значит на практике. Учитель, который пользуется ИИ-ассистентом для составления учебных планов, может быть уверен: инструмент прошёл независимую проверку, а не просто "показался умным" его создателям. Врач, который опирается на ИИ при анализе снимков, знает, что за системой стоит верификация с участием сотен экспертов. Мама в декрете, которая использует умный помощник для поиска информации о детском здоровье, получает инструмент, проверенный не одной компанией, а независимым советом специалистов. Это как знак качества на продуктах - только для технологий, которые влияют на нашу жизнь всерьёз.

Кстати, важно понимать масштаб этого решения. Партнёрство OpenAI и Microsoft уже сегодня генерирует около 50 миллиардов долларов в год. После верификации AGI этот показатель может вырасти до 200 миллиардов - за счёт широкого лицензирования технологий. Microsoft получает два года адаптационного периода после официального признания AGI, что мотивирует обе стороны вкладывать в совместные исследования безопасности ещё 10 миллиардов долларов. По оценкам аналитиков, прозрачная дорожная карта уже сейчас помогает миллиону разработчиков по всему миру строить планы уверённее. Это не просто корпоративная сделка - это стандарт, который уже вдохновил Google и Anthropic на создание аналогичных панелей.

Подумай вот о чём

Впервые в истории крупнейшие технологические компании добровольно согласились, что такой важный момент не может быть объявлен в одностороннем порядке. Это не регуляция сверху, не закон - это выбор. И именно добровольные стандарты часто меняют отрасль быстрее любых запретов.

Есть и честный нюанс. Процесс верификации занимает от полугода до года - это не мгновенно. Но именно эта пауза и есть защита: она отделяет реальный прорыв от рекламного заявления.

Пока нейросети не научились читать наши мысли и сами ставить себе лайки, мне всё еще нужна ваша поддержка! Подписывайтесь, чтобы не пропускать новые разборы - обещаю и дальше переводить с гиковского на русский.

Если статья зашла, смело жмите лайк и перешлите тому самому другу, который вечно не в теме. Ну и пишите в комменты: а вы станете больше доверять ИИ, если у него будет независимая оценка?