Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ Π² ΠΊΠΎΡ€Π·ΠΈΠ½ΡƒΠŸΠΎΠ·Π²ΠΎΠ½ΠΈΡ‚ΡŒ
Найти Π² Π”Π·Π΅Π½Π΅
МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

🌟 Hierarchical Reasoning Model: иСрархичСская модСль рассуТдСний, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Ρ€Π°Π±ΠΎΡ‚Ρƒ ΠΌΠΎΠ·Π³Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°

🌟 Hierarchical Reasoning Model: иСрархичСская модСль рассуТдСний, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Ρ€Π°Π±ΠΎΡ‚Ρƒ ΠΌΠΎΠ·Π³Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. Hierarchical Reasoning Model, (HRM) - рСкуррСнтная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°, которая Ρ‡Π΅Ρ€ΠΏΠ°Π΅Ρ‚ Π²Π΄ΠΎΡ…Π½ΠΎΠ²Π΅Π½ΠΈΠ΅ Π² ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… Ρ€Π°Π±ΠΎΡ‚Ρ‹ чСловСчСского ΠΌΠΎΠ·Π³Π°. Π’ Π΅Π΅ основС Π»Π΅ΠΆΠ°Ρ‚ 2 взаимозависимых Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Ρ… модуля: πŸŸ’ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ, высокоуровнСвый ΠΌΠΎΠ΄ΡƒΠ»ΡŒ (H-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ), ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΠ΅, абстрактноС ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ Ρ‚Π΅Ρ‚Π°-Π²ΠΎΠ»Π½Π°ΠΌ Π² ΠΌΠΎΠ·Π³Π΅. πŸŸ’Π’Ρ‚ΠΎΡ€ΠΎΠΉ, Π½ΠΈΠ·ΠΊΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹ΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ (L-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ), занимаСтся быстрыми ΠΈ Π΄Π΅Ρ‚Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌΠΈ вычислСниями, Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ Π³Π°ΠΌΠΌΠ°-Π²ΠΎΠ»Π½Π°ΠΌ. Π­Ρ‚Π° структура Π΄Π°Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎΡΡ‚ΠΈΠ³Π°Ρ‚ΡŒ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΠΉ для слоТных рассуТдСний, ΠΏΡ€ΠΈ этом сохраняя ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π²ΠΎ врСмя обучСния, Ρ‡Π΅Π³ΠΎ Ρ‚Π°ΠΊ Π½Π΅ Ρ…Π²Π°Ρ‚Π°Π΅Ρ‚ стандартным трансформСрам. πŸŸ‘Π’Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΠΈΠ΅ ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ Π½Π°Π·Π²Π°Π»ΠΈ "Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΎΠΉ ΠΊΠΎΠ½Π²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΠ΅ΠΉ". ΠŸΡ€ΠΎΡ†Π΅ΡΡ ΠΊΠ°Ρ€Π΄ΠΈΠ½Π°Π»ΡŒΠ½ΠΎ отличаСтся ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ происходит Π² ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Ρ… сСтях, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ склонны ΠΊ ΠΏΡ€Π΅ΠΆΠ΄Π΅Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ сходимости, ΠΊΠΎΠ³Π΄Π° ΠΈΡ… скрытоС состояниС быстро стабилизируСтся, ΠΈ

🌟 Hierarchical Reasoning Model: иСрархичСская модСль рассуТдСний, ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Ρ€Π°Π±ΠΎΡ‚Ρƒ ΠΌΠΎΠ·Π³Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°.

Hierarchical Reasoning Model, (HRM) - рСкуррСнтная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°, которая Ρ‡Π΅Ρ€ΠΏΠ°Π΅Ρ‚ Π²Π΄ΠΎΡ…Π½ΠΎΠ²Π΅Π½ΠΈΠ΅ Π² ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… Ρ€Π°Π±ΠΎΡ‚Ρ‹ чСловСчСского ΠΌΠΎΠ·Π³Π°. Π’ Π΅Π΅ основС Π»Π΅ΠΆΠ°Ρ‚ 2 взаимозависимых Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Ρ… модуля:

πŸŸ’ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ, высокоуровнСвый ΠΌΠΎΠ΄ΡƒΠ»ΡŒ (H-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ), ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΠ΅, абстрактноС ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅, ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎ Ρ‚Π΅Ρ‚Π°-Π²ΠΎΠ»Π½Π°ΠΌ Π² ΠΌΠΎΠ·Π³Π΅.

πŸŸ’Π’Ρ‚ΠΎΡ€ΠΎΠΉ, Π½ΠΈΠ·ΠΊΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹ΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ (L-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ), занимаСтся быстрыми ΠΈ Π΄Π΅Ρ‚Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌΠΈ вычислСниями, Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ Π³Π°ΠΌΠΌΠ°-Π²ΠΎΠ»Π½Π°ΠΌ.

Π­Ρ‚Π° структура Π΄Π°Π΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎΡΡ‚ΠΈΠ³Π°Ρ‚ΡŒ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΠΉ для слоТных рассуТдСний, ΠΏΡ€ΠΈ этом сохраняя ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π²ΠΎ врСмя обучСния, Ρ‡Π΅Π³ΠΎ Ρ‚Π°ΠΊ Π½Π΅ Ρ…Π²Π°Ρ‚Π°Π΅Ρ‚ стандартным трансформСрам.

πŸŸ‘Π’Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΠΈΠ΅ ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ Π½Π°Π·Π²Π°Π»ΠΈ "Π˜Π΅Ρ€Π°Ρ€Ρ…ΠΈΡ‡Π΅ΡΠΊΠΎΠΉ ΠΊΠΎΠ½Π²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΠ΅ΠΉ".

ΠŸΡ€ΠΎΡ†Π΅ΡΡ ΠΊΠ°Ρ€Π΄ΠΈΠ½Π°Π»ΡŒΠ½ΠΎ отличаСтся ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ происходит Π² ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Ρ… сСтях, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ склонны ΠΊ ΠΏΡ€Π΅ΠΆΠ΄Π΅Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ сходимости, ΠΊΠΎΠ³Π΄Π° ΠΈΡ… скрытоС состояниС быстро стабилизируСтся, ΠΈ дальнСйшиС вычислСния практичСски ΠΏΡ€Π΅ΠΊΡ€Π°Ρ‰Π°ΡŽΡ‚ΡΡ. Π’ HRM всС ΠΈΠ½Π°Ρ‡Π΅:

πŸŸ Π‘Π½Π°Ρ‡Π°Π»Π° быстрый L-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ выполняСт ΡΠ΅Ρ€ΠΈΡŽ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ, находя локальноС равновСсиС для Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ шага Π·Π°Π΄Π°Ρ‡ΠΈ. Π•Π³ΠΎ ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ΅ состояниС пСрСдаСтся ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΠΌΡƒ H-ΠΌΠΎΠ΄ΡƒΠ»ΡŽ.

🟠H-ΠΌΠΎΠ΄ΡƒΠ»ΡŒ, Π² свою ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ, осмысливаСт ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, выполняСт ΠΎΠ΄ΠΈΠ½ шаг собствСнного, Π±ΠΎΠ»Π΅Π΅ абстрактного обновлСния ΠΈ Π·Π°Π΄Π°Π΅Ρ‚ ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½ΠΎΠ²Ρ‹ΠΉ контСкст для L-модуля.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡƒΡ‚ΡŒ Π½ΠΈΠ·ΠΊΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²ΠΎΠ³ΠΎ модуля пСрСзапускаСтся, направляя Π΅Π³ΠΎ ΠΊ Π½ΠΎΠ²ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ локального равновСсия. ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ Π½Π΅ Π΄Π°Π΅Ρ‚ систСмС Π·Π°ΡΡ‚Ρ€ΡΡ‚ΡŒ ΠΈ позволяСт Π΅ΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ мноТСство Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ…, Π½ΠΎ взаимосвязанных этапов Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, выстраивая Π΄Π»ΠΈΠ½Π½Ρ‹Π΅ логичСскиС Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ.

ВСстовая модСль HRM с 27 ΠΌΠ»Π½. ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², обучСнная всСго Π½Π° 1000 ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… Π±Π΅Π· ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Π»ΠΈΠ±ΠΎ ΠΏΡ€Π΅Ρ‚Ρ€Π΅ΠΉΠ½Π° ΠΈΠ»ΠΈ CoT-ΠΏΠ°Ρ€, ΠΏΠΎΠΊΠ°Π·Π°Π»Π° Π½Π΅ΠΎΠΆΠΈΠ΄Π°Π½Π½ΠΎ высокиС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ .

На Π·Π°Π΄Π°Ρ‡Π°Ρ…, Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‰ΠΈΡ… Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ поиска ΠΈ ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π° Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² ( Sudoku-Extreme ) ΠΈ поиск ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΡƒΡ‚ΠΈ ( Maze 30x30 ), HRM достигла ΠΏΠΎΡ‡Ρ‚ΠΈ идСальной точности, Π° Π²ΠΎΡ‚ CoT-ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΏΡ€ΠΎΠ²Π°Π»ΠΈΠ»ΠΈΡΡŒ с Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ 0%.

На Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ΅ ARC-AGI-1, HRM ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π² 40.3%. Для сравнСния, o3-mini-high ΠΏΠΎΠΊΠ°Π·Π°Π»Π° 34.5%, Π° Claude 3.7 с контСкстом 8K - 21.2%.

▢️ ВСса ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ для ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ воспроизвСдСния тСстов:

🟒ARC-AGI-2;

🟒Sudoku 9x9 Extreme (1000 examples);

🟒Maze 30x30 Hard (1000 examples);

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache 2.0 License.

πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ

🟑Arxiv

πŸ–₯Github

@machinelearning

#AI #ML #HRM #SapientInc

-2