Благодаря недавнему прорыву ученые улучшили мыслительные способности систем искусственного интеллекта (ИИ), научив их имитировать «внутренний монолог», прежде чем отвечать на подсказки. Этот метод, известный как Quiet-STaR, побуждает ИИ генерировать множество внутренних обоснований перед тем, как дать ответ, подобно тому, как люди рассматривают различные возможности, прежде чем говорить.
Традиционным чат-ботам с искусственным интеллектом, таким как ChatGPT, обычно не хватает способности к упреждающему мышлению, они реагируют на основе заранее определенных алгоритмов без подлинного понимания или предусмотрительности. Однако технология Quiet-STaR позволяет системам ИИ предвидеть будущие разговоры и учиться на прошлых взаимодействиях, отбрасывая неверные обоснования.
Исследователи применили алгоритм Quiet-STaR к Mistral 7B, модели большого языка (LLM) с открытым исходным кодом, и заметили значительные улучшения в возможностях рассуждения. Обученный Quiet-STaR Mistral 7B показал заметно более высокие результаты в тестах на рассуждение, достигнув точности 47,2% по сравнению с 36,3% до обучения. Несмотря на то, что у него все еще были проблемы с тестом по математике, его результаты выросли почти вдвое — с 5,9% до 10,9%.
Это достижение имеет решающее значение, поскольку традиционные модели искусственного интеллекта, включая нейронные сети, такие как ChatGPT и Gemini, часто не справляются с здравым смыслом и контекстуализацией. Предыдущие усилия по решению этой проблемы были ограничены конкретными областями и не могли быть универсально применены ко всем моделям ИИ.
Интеграция упреждающего мышления в системы искусственного интеллекта с помощью метода Quiet-STaR демонстрирует большой потенциал в сокращении неравенства между искусственным интеллектом и способностями рассуждения, подобными человеческим. Исследователи стремятся повысить адаптивность и контекстуальную осведомленность этих систем, тем самым улучшая их способность участвовать в значимых разговорах и задачах.
Quiet-STaR, названный в честь своей способности работать незаметно в фоновом режиме и применяться в различных программах LLM, представляет собой значительный шаг на пути к разработке систем искусственного интеллекта с улучшенными способностями к рассуждению. В дальнейшем ученые планируют изучить, как подобные методы могут еще больше сократить разрыв между ИИ и человеческим познанием, приближая нас к созданию искусственного «суперинтеллекта» и более сложных приложений на основе ИИ.