Meituan ΠΎΡΠΊΡΡΠ»Π° LongCat-Next, Π½Π°ΡΠΈΠ²Π½ΡΡ ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΡΡ autoregressive-ΠΌΠΎΠ΄Π΅Π»Ρ. ΠΠ½Π° ΡΠ°Π±ΠΎΡΠ°Π΅Ρ Ρ ΡΠ΅ΠΊΡΡΠΎΠΌ, ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ ΠΈ Π°ΡΠ΄ΠΈΠΎ Π² ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΈΡΠΊΡΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π΅ ΡΠΎΠΊΠ΅Π½ΠΎΠ², ΠΏΠΎΡΡΡΠΎΠ΅Π½Π° Π½Π° MoE-Π±ΡΠΊΠ΅Π½Π΄Π΅ LongCat-Flash-Lite ΠΈ ΠΈΠΌΠ΅Π΅Ρ 68,5 ΠΌΠ»ΡΠ΄ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² ΠΏΡΠΈ 3 ΠΌΠ»ΡΠ΄ Π°ΠΊΡΠΈΠ²Π½ΡΡ
. ΠΠ»Π°Π²Π½Π°Ρ ΠΈΠ΄Π΅Ρ Π² ΡΠΎΠΌ, ΡΡΠΎ ΠΌΠΎΠ΄Π΅Π»Ρ Π½Π΅ ΡΠΊΠ»Π΅ΠΈΠ²Π°Π΅Ρ ΠΎΡΠ΄Π΅Π»ΡΠ½ΡΠ΅ ΠΏΠΎΠ΄ΡΠΈΡΡΠ΅ΠΌΡ, Π° ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅Ρ ΡΠ°Π·Π½ΡΠ΅ ΠΌΠΎΠ΄Π°Π»ΡΠ½ΠΎΡΡΠΈ Π² ΠΎΠ΄Π½ΠΎΠΉ ΡΡ
Π΅ΠΌΠ΅ next-token prediction. Π Π°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΈ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎ Π²ΡΠ΄Π΅Π»ΡΡΡ DiNA ΠΊΠ°ΠΊ ΠΎΠ±ΡΠΈΠΉ ΠΏΠΎΠ΄Ρ
ΠΎΠ΄ Π΄Π»Ρ ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΠΎΡΡΠΈ ΠΈ dNaViT ΠΊΠ°ΠΊ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΡΠΉ ΡΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΎΡ, ΠΊΠΎΡΠΎΡΡΠΉ Π½ΡΠΆΠ΅Π½ ΠΈ Π΄Π»Ρ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ, ΠΈ Π΄Π»Ρ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ. ΠΠ° ΠΏΡΠ°ΠΊΡΠΈΠΊΠ΅ ΡΡΠΎ Π΄Π°ΡΡ ΠΎΠ΄Π½Ρ ΡΠΈΡΡΠ΅ΠΌΡ Π΄Π»Ρ OCR, Π³ΡΠ°ΡΠΈΠΊΠΎΠ², GUI, Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ, ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ ΠΈ ΡΠΈΠ½ΡΠ΅Π·Π° ΡΠ΅ΡΠΈ, Π²ΠΊΠ»ΡΡΠ°Ρ ΠΊΠ»ΠΎΠ½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π³ΠΎΠ»ΠΎΡΠ°. ΠΠ»Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ² Π΅ΡΡ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, ΡΡΠΎ Π² model card ΠΏΡΡΠΌΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½Ρ ΡΡΠ΅Π½Π°ΡΠΈΠΈ text, image, audio ΠΈ tool calling. ΠΠΎ ΡΡΠΎ Π½Π΅ ΠΈΡΡΠΎΡΠΈΡ ΠΏΡΠΎ Π·Π°ΠΏΡΡΠΊ βΠ½Π° ΡΡΠΌ ΡΠ³ΠΎΠ΄Π½ΠΎβ. Π ΠΎΠΏΠΈΡΠ°Π½ΠΈΠΈ ΡΠΊΠ°Π·Π°Π½ΠΎ, ΡΡΠΎ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ ΡΠ΅ΡΠ΅Π· Transformers Π½ΡΠΆΠ½ΠΎ ΠΌΠΈΠ½ΠΈΠΌΡΠΌ 3 GPU ΠΏΠΎ 80 ΠΠ VRAM, ΡΠ°ΠΊ ΡΡΠΎ ΠΏΠΎΠΊΠ° ΡΡΠΎ ΡΠΊΠΎΡΠ΅Π΅ ΠΎΡΠΊΡΡΡΠ°Ρ ΠΈΡ
π± LongCat-Next: ΠΎΠ΄Π½Π° ΠΌΠΎΠ΄Π΅Π»Ρ Π΄Π»Ρ ΡΠ΅ΠΊΡΡΠ°, ΠΊΠ°ΡΡΠΈΠ½ΠΎΠΊ ΠΈ ΡΠ΅ΡΠΈ
25Β ΠΌΠ°ΡΡΠ°25Β ΠΌΠ°Ρ
~1 ΠΌΠΈΠ½