Найти Π² Π”Π·Π΅Π½Π΅
PythonTalk

🧠 МСньшС β€” Π·Π½Π°Ρ‡ΠΈΡ‚ большС? НСйронка Π½Π° 7ΠœΠ‘ ΡƒΠ΄Π΅Π»Ρ‹Π²Π°Π΅Ρ‚ LLM-Π³ΠΈΠ³Π°Π½Ρ‚ΠΎΠ²

🧠 МСньшС β€” Π·Π½Π°Ρ‡ΠΈΡ‚ большС? НСйронка Π½Π° 7ΠœΠ‘ ΡƒΠ΄Π΅Π»Ρ‹Π²Π°Π΅Ρ‚ LLM-Π³ΠΈΠ³Π°Π½Ρ‚ΠΎΠ².

Пока всС ΠΌΠ΅Ρ€ΡΡŽΡ‚ΡΡ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π°ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², появилась модСлька TRM (Tiny Recursive Model) Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ всСго Π² 7Мб, которая Ρ€Π΅ΡˆΠ°Π΅Ρ‚ слоТныС логичСскиС Π³ΠΎΠ»ΠΎΠ²ΠΎΠ»ΠΎΠΌΠΊΠΈ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ Π³ΠΈΠ³Π°Π½Ρ‚Ρ‹ Π²Ρ€ΠΎΠ΄Π΅ Gemini.

ИдСя проста: вмСсто Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΌΠΎΠ½ΡΡ‚Ρ€ΡƒΠΎΠ·Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ, которая "Π΄ΡƒΠΌΠ°Π΅Ρ‚" ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·, TRM ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΊΡ€ΠΎΡˆΠ΅Ρ‡Π½ΡƒΡŽ Π΄Π²ΡƒΡ…ΡΠ»ΠΎΠΉΠ½ΡƒΡŽ сСтку, которая ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎ ΠΈ рСкурсивно ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ свой собствСнный ΠΎΡ‚Π²Π΅Ρ‚. Она Π±ΡƒΠΊΠ²Π°Π»ΡŒΠ½ΠΎ "пСрСпровСряСт" ΠΈ "Π΄ΠΎΠ΄ΡƒΠΌΡ‹Π²Π°Π΅Ρ‚" Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ шаг Π·Π° шагом.

Π§Ρ‚ΠΎ ΠΏΠΎ Ρ†ΠΈΡ„Ρ€Π°ΠΌ?

- На ТСстких Π³ΠΎΠ»ΠΎΠ²ΠΎΠ»ΠΎΠΌΠΊΠ°Ρ… ARC-AGI-2 (Π³Π΄Π΅ Gemini 2.5 Pro Π½Π°Π±ΠΈΡ€Π°Π΅Ρ‚ ΠΆΠ°Π»ΠΊΠΈΠ΅ 4.9%) эта ΠΌΠ°Π»Ρ‹ΡˆΠΊΠ° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ 7.8%.

- На ΡΠΊΡΡ‚Ρ€Π΅ΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… Π‘ΡƒΠ΄ΠΎΠΊΡƒ β€” 87% точности ΠΏΡ€ΠΎΡ‚ΠΈΠ² 55% Ρƒ своСго Π±ΠΎΠ»Π΅Π΅ слоТного ΠΏΡ€Π΅Π΄ΡˆΠ΅ΡΡ‚Π²Π΅Π½Π½ΠΈΠΊΠ°.

И всС это ΠΏΡ€ΠΈ Ρ€Π°Π·ΠΌΠ΅Ρ€Π΅ <0.01% ΠΎΡ‚ Ρ‚ΠΈΠΏΠΈΡ‡Π½ΠΎΠΉ LLM.

И это ΠΏΠΎΠ»Π½ΠΎΡ†Π΅Π½Π½Ρ‹ΠΉ опСнсорс-ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Π½Π° PyTorch. Авторы просто взял ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΡƒΡŽ ΡΠ»ΠΎΠΆΠ½ΡƒΡŽ модСль, Π²Ρ‹ΠΊΠΈΠ½ΡƒΠ» ΠΈΠ· Π½Π΅Π΅ всю "биологичСски-ΠΈΠ½ΡΠΏΠΈΡ€ΠΈΡ€ΠΎΠ²Π°Π½Π½ΡƒΡŽ" ΡˆΠ΅Π»ΡƒΡ…Ρƒ, оставил Ρ€Π°Π±ΠΎΡ‡ΡƒΡŽ ΡΡƒΡ‚ΡŒ β€” ΠΈ Π²Π½Π΅Π·Π°ΠΏΠ½ΠΎ всС Π·Π°Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΎ Π² Ρ€Π°Π·Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅.

ΠžΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ΡΡ, изящная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ эффСктивнСС ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ° "scale is all you need" для спСциализированных Π·Π°Π΄Π°Ρ‡.

πŸ‘‰ Бсылка Π½Π° ΡΡ‚Π°Ρ‚ΡŒΡŽ

πŸ‘‰ Бсылка Π½Π° Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ с ΠΊΠΎΠ΄ΠΎΠΌ

#Π³ΠΎΠ΄Π½Ρ‹ΠΉ_опСнсорс