213 подписчиков

🧠🔮 Искусственный интеллект учится видеть будущее: как новое поколение моделей может изменить прогнозирование

28 мая 202528 мая 2025

4 мин

Технологии искусственного интеллекта не стоят на месте, и с каждым днём мы всё ближе подходим к созданию систем, способных не просто обрабатывать данные, но и уверенно предсказывать будущее. Недавно исследователи из компании Lightning Rod Labs, совместно с учёными из Стэнфорда и Лондонской школы экономики, совершили новый прорыв — они применили методы обучения с подкреплением для улучшения качества прогнозов, продемонстрировав не только высокую точность, но и возможность использовать такие модели в реальных экономических задачах. Ключевое новшество заключается в использовании обучения с подкреплением, адаптированного для задач прогнозирования, где результаты приходят не сразу и зачастую сопровождаются неопределённостью. Исследователи применили два передовых алгоритма: Авторы адаптировали эти методы, чтобы они могли работать с вероятностными прогнозами, что оказалось непростой задачей: модели часто начинали давать «крайние» предсказания (0% или 100%), что является нежелательным в услови

Оглавление

🎯 В чём суть нового подхода?
🔧 Технические хитрости и реализация
📊 Как измеряли качество?

Неоновый «хрустальный шар» с растущими графиками и час-песочницей внутри; извне к шару устремляются стрелки от мозгового чипа и куба-агента — визуальный символ RL, который, опираясь на исходы, делает всё более точные прогнозы будущего.

🎯 В чём суть нового подхода?

Ключевое новшество заключается в использовании обучения с подкреплением, адаптированного для задач прогнозирования, где результаты приходят не сразу и зачастую сопровождаются неопределённостью.

Исследователи применили два передовых алгоритма:

⚙️ Group-Relative Policy Optimisation (GRPO): известный своей эффективностью в задачах с чёткими и быстрыми результатами.
⚙️ ReMax: алгоритм, обеспечивающий стабильность и точность в условиях неопределённости.

Авторы адаптировали эти методы, чтобы они могли работать с вероятностными прогнозами, что оказалось непростой задачей: модели часто начинали давать «крайние» предсказания (0% или 100%), что является нежелательным в условиях реальных задач.

🔧 Технические хитрости и реализация

Чтобы избежать проблем и повысить стабильность, исследователи добавили несколько оригинальных решений:

🛠️ Лёгкие защитные механизмы (guard-rails): специальные проверки, которые штрафуют модель за бессмысленные или неполные ответы.
📈 Использование синтетических данных: добавили 100 тысяч синтетических вопросов, созданных автоматически, чтобы модель могла «увидеть» больше сценариев и лучше адаптироваться к разнообразию реальных ситуаций.
📏 Нормализация и масштабирование сигналов ошибки: чтобы модель лучше училась на значительных ошибках, исследователи убрали из GRPO стандартную нормализацию на отклонения, что помогло избежать чрезмерной уверенности или неадекватных прогнозов.

📊 Как измеряли качество?

Команда протестировала модель на огромном наборе вопросов (3300 событий), который включал экономику, политику, погоду и другие актуальные темы. Сравнивали результаты:

📌 Точность прогнозов измерялась через показатель Брайера (Brier Score) — чем он ниже, тем лучше прогноз.
📌 Калибровка оценивалась с помощью показателя ECE (Expected Calibration Error), где также меньшие значения говорят о более надёжной оценке вероятностей.
📌 Экономическая эффективность проверялась через гипотетическую торговлю на рынке предсказаний (Polymarket), где модель «делала ставки» на свои прогнозы.

💰 Итоги и выводы исследования

Результаты оказались впечатляющими:

🎯 Точность на уровне передовых моделей: Модель на основе алгоритма ReMax показала точность, сравнимую с лучшими существующими решениями (например, моделью OpenAI o1).
🎯 Высокая калибровка: Модель оказалась гораздо лучше конкурентов в правильности оценки собственных прогнозов, что критически важно для экономических решений.
💸 Гипотетическая торговля: На виртуальных торгах модель заработала $127, тогда как ближайший конкурент (модель OpenAI o1) получила $92. Это значительная разница, которая подчёркивает практическую ценность таких моделей.

Особенно интересен вывод, что даже сравнительно небольшие модели (с 14 млрд параметров) при правильной настройке и обучении могут составить достойную конкуренцию гигантам рынка.

🔍 Личные наблюдения автора

С моей точки зрения, одно из наиболее ярких достижений этого исследования — подтверждение идеи, что ключ к эффективному прогнозированию лежит не в увеличении размера моделей до астрономических масштабов, а в грамотном подходе к обучению и точной настройке алгоритмов. Это делает такие технологии гораздо доступнее, позволяя применять их в самых разных областях — от финансов до медицины.

Ещё один важный аспект — экономическая применимость результатов. Система не просто показывает точные прогнозы, она демонстрирует, как их можно использовать на практике для получения реальной прибыли. Это может стать мощным стимулом для внедрения подобных решений в бизнес-процессы.

В перспективе такие модели смогут не только помогать инвесторам или аналитикам, но и изменят подход к принятию решений в целом. Представьте мир, в котором политические, экономические и даже бытовые решения будут приниматься на основе объективных и проверенных моделей прогнозирования.

🚀 Что дальше?

Команда уже наметила планы по дальнейшему совершенствованию технологии:

⚖️ Улучшение стабильности и чувствительности модели.
📡 Расширение применения на другие области — например, онкологию, нейробиологию и восстановительную медицину.
🧑‍💻 Подготовка технологии к предклиническим и клиническим исследованиям.

Скорее всего, в ближайшие годы нас ждёт всплеск разработок, основанных на этом подходе.

📰 Оригинал новости:

Outcome-Based Reinforcement Learning to Predict the Future