ΠΠ°Π±ΠΎΡΠ°ΡΠΎΡΠΈΡ Sakana AI Π²ΡΠΊΠ°ΡΠΈΠ»Π° ΡΠ°Π±ΠΎΡΡ, ΠΊΠΎΡΠΎΡΠ°Ρ Ρ
ΠΎΡΠΎΡΠΎ Π»ΠΎΠΆΠΈΡΡΡ Π½Π° ΡΠ΅ΠΊΡΡΠ΅Π΅ ΠΎΡΡΡΠ΅Π½ΠΈΠ΅ Π²ΡΠ΅ΠΉ ΠΈΠ½Π΄ΡΡΡΡΠΈΠΈ: Π±Π΅ΡΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠ΅ ΡΠΊΠ΅ΠΉΠ»ΠΈΠ½Π³-ΠΌΠ°ΡΠ°ΡΠΎΠ½ Ρ ΠΎΠ΄ΠΈΠ½ΠΎΡΠ½ΡΠΌΠΈ ΠΌΠΎΠ½ΠΎΠ»ΠΈΡΠ½ΡΠΌΠΈ ΠΌΠΎΠ΄Π΅Π»ΡΠΌΠΈ ΠΏΠΎΡΡΠ΅ΠΏΠ΅Π½Π½ΠΎ ΡΠΏΠΈΡΠ°Π΅ΡΡΡ Π² ΡΡΠ΅Π½Ρ diminishing returns. ΠΡ
ΠΎΡΠ²Π΅Ρ Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ TRINITY, ΠΈ ΡΡΠΎ Π½Π΅ ΠΎΡΠ΅ΡΠ΅Π΄Π½Π°Ρ Π³ΠΈΠ³Π°Π½ΡΡΠΊΠ°Ρ LLM, Π° Π»ΡΠ³ΠΊΠΈΠΉ ΠΊΠΎΠΎΡΠ΄ΠΈΠ½Π°ΡΠΎΡ ΠΏΠΎΠ²Π΅ΡΡ
ΡΠΆΠ΅ ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΡ
ΡΠΎΠΏΠΎΠ²ΡΡ
ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π‘ΡΠ°ΡΡΡ ΠΏΡΠΈΠ½ΡΡΠ° Π½Π° ICLR 2026. ΠΠ΄Π΅Ρ ΠΏΡΠΎΡΡΠ°Ρ ΠΏΠΎ ΡΠΎΡΠΌΠ΅ ΠΈ Π΄ΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ Π΄Π΅ΡΠ·ΠΊΠ°Ρ ΠΏΠΎ ΡΡΡΠΈ. ΠΠΌΠ΅ΡΡΠΎ ΡΠΎΠ³ΠΎ ΡΡΠΎΠ±Ρ ΠΎΠ±ΡΡΠ°ΡΡ ΠΎΠ΄Π½Ρ ΠΎΠ³ΡΠΎΠΌΠ½ΡΡ ΡΠ΅ΡΠΊΡ ΠΏΠΎΠ΄ Π²ΡΠ΅ Π·Π°Π΄Π°ΡΠΈ, Π°Π²ΡΠΎΡΡ ΠΏΡΠ΅Π΄Π»Π°Π³Π°ΡΡ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° ΡΡΠ°ΠΏΠ΅ ΠΈΠ½ΡΠ΅ΡΠ΅Π½ΡΠ° (test-time model composition). TRINITY Π΄ΠΈΡΠΈΠΆΠΈΡΡΠ΅Ρ ΠΏΡΠ»ΠΎΠΌ ΡΠ°Π·Π½ΡΡ
state-of-the-art LLM, Π½Π΅ ΡΡΠΎΠ³Π°Ρ ΠΈΡ
Π²Π΅ΡΠ° ΠΈ Π½Π΅ ΡΡΠ΅Π±ΡΡ ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΠΎΠΉ Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΡ. ΠΠΎ ΡΡΡΠΈ, ΡΡΠΎ ΠΏΠΎΠΏΡΡΠΊΠ° ΠΎΠ±ΠΎΠΉΡΠΈ Π³Π»Π°Π²Π½ΡΠ΅ Π±ΠΎΠ»ΠΈ model merging: ΡΠ°Π·Π½ΡΠ΅ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ ΡΠΊΡΡΡΡΡ
ΡΠΎΡΡΠΎΡΠ½ΠΈΠΉ, ΡΠ°Π·Π½ΡΠ΅ ΡΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΎΡΡ ΠΈ Π·Π°ΠΊΡΡΡΡΠ΅ Π²Π΅ΡΠ° ΡΡΠΎΠ½ΡΠΈΡΠ½ΡΡ
ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π Π°Π±ΠΎΡΠ°Π΅Ρ ΡΡΠΎ ΠΈΡΠ΅ΡΠ°ΡΠΈΠ²Π½ΠΎ, Π² Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Ρ
ΠΎΠ΄ΠΎΠ². ΠΠ° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΡΠ°Π³Π΅ ΠΊΠΎΠΎΡΠ΄ΠΈΠ½Π°ΡΠΎΡ ΡΠΌΠΎΡΡΠΈΡ Π½Π° ΡΠ΅ΠΊΡΡΠ΅Π΅ ΡΠΎΡΡΠΎΡΠ½ΠΈΠ΅ Π·Π°Π΄Π°ΡΠΈ ΠΈ Π½Π°Π·Π½Π°ΡΠ°Π΅Ρ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π΄ΠΎΡΡΡΠΏΠ½ΡΡ
LLM ΠΎΠ΄Π½Ρ ΠΈΠ· ΡΡΡΡ
ΡΠΎΠ»Π΅ΠΉ. Thinker ΡΡΡ
π ΠΠ²ΠΎΠ»ΡΡΠΈΡ Π²ΠΌΠ΅ΡΡΠΎ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°Π½ΠΈΡ: TRINITY ΠΎΡ Sakana AI Π²ΡΠΆΠΈΠΌΠ°Π΅Ρ 86,2% Π½Π° LiveCodeBench ΠΈΠ· Π³ΠΎΡΠΎΠ²ΡΡ LLM
26Β Π°ΠΏΡΠ΅Π»Ρ26Β Π°ΠΏΡ
53
3 ΠΌΠΈΠ½