Arcee AI ΠΏΡΠ΅Π΄ΡΡΠ°Π²ΠΈΠ»ΠΈ Trinity-Mini β ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΡΡ MoE (Mixture of Experts β ΠΌΠΎΠ΄Π΅Π»Ρ Π°ΠΊΡΠΈΠ²ΠΈΡΡΠ΅Ρ ΡΠΎΠ»ΡΠΊΠΎ ΡΠ°ΡΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡΠΎΠΊΠ΅Π½Π°) Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΡ Π½Π° 26B ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ², ΠΈΠ· ΠΊΠΎΡΠΎΡΡΡ
Π°ΠΊΡΠΈΠ²Π½Ρ Π²ΡΠ΅Π³ΠΎ 3B. ΠΠΎΠ΄Π΅Π»Ρ ΠΎΠ±ΡΡΠ΅Π½Π° Π½Π° ΠΊΠΎΠ»ΠΎΡΡΠ°Π»ΡΠ½ΠΎΠΌ Π΄Π°ΡΠ°ΡΠ΅ΡΠ΅ Π² 10 ΡΡΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² ΡΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ ΡΠ»ΠΎΠΆΠ½ΡΠ΅ ΡΠ°ΡΡΡΠΆΠ΄Π΅Π½ΠΈΡ ΠΈ ΠΊΠΎΠ΄ΠΈΠ½Π³. ΠΠ»Π°Π²Π½Π°Ρ ΡΠΈΡΠΊΠ° ΡΡΠΎΠ³ΠΎ ΡΠ΅Π»ΠΈΠ·Π° β ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΡΠΉ FP8-ΠΊΠ²Π°Π½Ρ Ρ ΠΏΠΎΠ±Π»ΠΎΡΠ½ΡΠΌ ΡΠΊΠ°Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. ΠΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π·Π°ΠΏΡΡΠΊΠ°ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈ Π±Π΅Π· ΠΏΠΎΡΠ΅ΡΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π°, Π½ΠΎ Ρ ΠΠΠ‘Π―Π’ΠΠΠ ΠΠ’ΠΠ«Π ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²ΠΎΠΌ Π² ΠΏΡΠΎΠΏΡΡΠΊΠ½ΠΎΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡΠΈ Π½Π° ΠΊΠ°ΡΡΠ°Ρ
NVIDIA Hopper (H100/H200). ΠΠ° Π±Π΅Π½ΡΠΌΠ°ΡΠΊΠ΅ BFCL V3 (Berkeley Function Calling Leaderboard β ΡΠ΅ΡΡ Π½Π° ΡΠ°Π±ΠΎΡΡ Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΠΌΠΈ ΠΈ API) Trinity-Mini Π½Π°Π±ΡΠ°Π»Π° 59.67%, ΡΠ²Π΅ΡΠ΅Π½Π½ΠΎ ΠΎΠ±ΠΎΠΉΠ΄Ρ ΠΊΠΎΠ½ΠΊΡΡΠ΅Π½ΡΠΎΠ² Π²ΡΠΎΠ΄Π΅ gpt-oss ΠΈ Magistral. ΠΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΠ° ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ 128 ΡΠΊΡΠΏΠ΅ΡΡΠΎΠ² (8 Π°ΠΊΡΠΈΠ²Π½ΡΡ
Π½Π° ΡΠΎΠΊΠ΅Π½), ΡΡΠΎ Π΄Π°Π΅Ρ Π²ΡΡΠΎΠΊΡΡ ΠΏΠ»ΠΎΡΠ½ΠΎΡΡΡ Π·Π½Π°Π½ΠΈΠΉ ΠΏΡΠΈ Π½ΠΈΠ·ΠΊΠΈΡ
Π·Π°ΡΡΠ°ΡΠ°Ρ
Π½Π° ΠΈΠ½ΡΠ΅ΡΠ΅Π½Ρ. ΠΠΎΠ΄Π΅Π»Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ½ΠΎΠ΅ ΠΎΠΊΠ½ΠΎ Π² 128k ΡΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈ ΠΏΠΎΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ ΠΏΠΎΠ΄ Π»ΠΈΡΠ΅Π½Π·ΠΈΠ΅ΠΉ Apache 2.0, ΡΡΠΎ Π΄Π΅Π»Π°Π΅Ρ Π΅Ρ ΠΈΠ΄Π΅Π°Π»ΡΠ½ΡΠΌ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°ΡΠΎΠΌ Π΄Π»Ρ self-hos
πβ‘β‘ Trinity-Mini: 26B MoE-ΠΌΠΎΠ΄Π΅Π»Ρ ΠΎΡ Arcee AI Ρ 128k ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠΎΠΌ ΠΈ FP8-ΠΎΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠ΅ΠΉ
Π‘Π΅Π³ΠΎΠ΄Π½ΡΠ‘Π΅Π³ΠΎΠ΄Π½Ρ
1 ΠΌΠΈΠ½