10,2 ΡΡΡ ΠΏΠΎΠ΄ΠΏΠΈΡΡΠΈΠΊΠΎΠ²
π Jamba 1.5: Π‘Π΅ΠΌΠ΅ΠΉΡΡΠ²ΠΎ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ΅ SSM-Transformer Ρ Π±ΠΎΠ»ΡΡΠΈΠΌ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ½ΡΠΌ ΠΎΠΊΠ½ΠΎΠΌ.
AI21 Labs ΠΎΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° Π² ΠΎΡΠΊΡΡΡΠΎΠΌ Π΄ΠΎΡΡΡΠΏΠ΅ ΡΠ΅ΠΌΠ΅ΠΉΡΡΠ²ΠΎ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Jamba 1.5. ΠΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΠ·ΠΈΡΠΈΠΎΠ½ΠΈΡΠΎΠ²Π°Π½Ρ Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² Π±ΠΈΠ·Π½Π΅ΡΠ΅ Π΄Π»Ρ Π·Π°Π΄Π°Ρ Π°Π½Π°Π»ΠΈΠ·Π° Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², ΡΠ°Π±ΠΎΡΠΈΡ
ΠΏΡΠΎΡΠ΅ΡΡΠΎΠ² RAG, ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠΈ ΠΊΠ»ΠΈΠ΅Π½ΡΠΎΠ² ΠΈ ΠΎΠ±Π»Π°Π΄Π°ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡΠΌΠΈ Π²ΡΠ·ΠΎΠ²Π° ΡΡΠ½ΠΊΡΠΈΠΉ, ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Π²ΡΠ²ΠΎΠ΄Π° (JSON) ΠΈ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ
Π΄Π°Π½Π½ΡΡ
.
Π‘Π΅ΠΌΠ΅ΠΉΡΡΠ²ΠΎ Π΄Π΅ΠΌΠΎΠ½ΡΡΡΠΈΡΡΠ΅Ρ Ρ
ΠΎΡΠΎΡΡΡ ΡΠΏΡΠ°Π²Π»ΡΠ΅ΠΌΠΎΡΡΡ Π² Π΄Π»ΠΈΡΠ΅Π»ΡΠ½ΠΎΠΌ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ΅, ΡΠΊΠΎΡΠΎΡΡΡ ΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ. ΠΡΠΎ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΊΠ΅ΠΉΡ ΡΡΠΏΠ΅ΡΠ½ΠΎΠ³ΠΎ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π½Π΅ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ΅ΡΠ½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎ ΡΡΠΎΠ²Π½Ρ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΡΠΎΠΏΠΎΠ²ΡΡ
ΠΎΡΠΊΡΡΡΡΡ
ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
ΠΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΠ° Jamba ΡΠΎΡΡΠΎΠΈΡ ΠΈΠ· Π³ΠΈΠ±ΡΠΈΠ΄Π½ΠΎΠ³ΠΎ ΡΠΎΡΠ΅ΡΠ°Π½ΠΈΡ Transformers ΠΈ Mamba, ΡΡΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ ΡΠΎΠ·Π΄Π°ΡΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΡΠ΅Π±ΡΡΡ ΠΌΠ΅Π½ΡΡΠΈΠΉ ΠΎΠ±ΡΠ΅ΠΌ VRAM, ΡΠ΅ΠΌ ΡΡΠ°Π½ΡΡΠΎΡΠΌΠ΅ΡΠ½ΡΠ΅ Π°Π½Π°Π»ΠΎΠ³ΠΈ ΠΈ ΠΌΠΎΠ³ΡΡ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΡ Π΄Π»ΠΈΠ½ΠΎΠΉ Π΄ΠΎ 140 ΡΡΡΡΡ ΡΠΎΠΊΠ΅Π½ΠΎΠ² Π½Π° ΠΎΠ΄Π½ΠΎΠΌ GPU Π² ΠΊΠ²Π°Π½ΡΠΎΠ²Π°Π½Π½ΠΎΠΉ Π²Π΅ΡΡΠΈΠΈ.
Π§ΡΠΎΠ±Ρ ΡΠ΄Π΅Π»Π°ΡΡ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠ΄ΠΎΠ±Π½ΡΠΌΠΈ Π² ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ, Π±ΡΠ»Π° ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π° Π½ΠΎΠ²Π°Ρ ΡΠ΅Ρ
Π½ΠΈΠΊΠ° ΠΊΠ²Π°Π½ΡΠΎΠ²Π°Π½ΠΈΡ ExpertsInt8. ΠΠ½Π° ΠΊΠ²Π°Π½ΡΡΠ΅Ρ ΡΠΎΠ»ΡΠΊΠΎ Π²Π΅ΡΠ°, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ²Π»ΡΡΡΡΡ ΡΠ°ΡΡΡΡ ΡΠ»ΠΎΠ΅Π² MoE, ΠΈ ΡΠΎΡ
ΡΠ°Π½ΡΠ΅Ρ ΠΈΡ
Π² ΡΠΎΡΠΌΠ°ΡΠ΅ INT8.
ExpertsInt8 Π±ΡΡΡΡΠ΅Π΅ Π΄ΡΡΠ³ΠΈΡ
ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΊΠ²Π°Π½ΡΠΎΠ²Π°Π½ΠΈΡ, Π½Π΅ ΡΡΠ΅Π±ΡΠ΅Ρ ΠΊΠ°Π»ΠΈΠ±ΡΠΎΠ²ΠΊΠΈ ΠΈ Π΄Π°Π΅Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ BF16 Π΄Π»Ρ Ρ
ΡΠ°Π½Π΅Π½ΠΈΡ Π±ΠΎΠ»ΡΡΠΈΡ
Π°ΠΊΡΠΈΠ²Π°ΡΠΈΠΉ ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π·Π°Π³ΡΡΠΆΠ°ΡΡ Large ΠΌΠΎΠ΄Π΅Π»Ρ Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΡΠ·Π»Π΅ ΠΈΠ· 8 GPU.
π total params - 399B;
π active non-embedding params - 94B;
π context - 256Π.
π’total params - 52B;
π’active non-embedding params - 12B;
π’context - 256Π;
π’Int8 context - 140Π.
ΠΠ°ΠΏΡΡΠΊ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π²ΠΎΠ·ΠΌΠΎΠΆΠ΅Π½ Π½Π° ΠΏΠ»Π°ΡΡΠΎΡΠΌΠ°Ρ
AI21 Studio, Google Cloud, Azure, Hugging Face, NVIDIA NIM.
ΠΡΠΎΡΠ΅ΡΡΠΈΡΠΎΠ²Π°ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ ΠΎΠ±Π΅ΠΈΡ
ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ½Π»Π°ΠΉΠ½ Π² ΡΠ΅ΡΠ²ΠΈΡΠ΅ AI21 Studio .
ΠΠΎΡΡΡΠΏΠ΅Π½ Π²Ρ
ΠΎΠ΄ Ρ Gmail ΠΈ Github, Π½Π° Π±Π΅ΡΠΏΠ»Π°ΡΠ½ΡΠΉ ΡΠ΅ΡΡΠΎΠ²ΡΠΉ ΠΏΠ΅ΡΠΈΠΎΠ΄ Π΄Π°Π΅ΡΡΡ 10$ Π½Π° ΡΡΠΈ ΠΌΠ΅ΡΡΡΠ° ΠΏΡΠΈ ΡΠ°ΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ:
π Jamba 1.5 Large - 2 $ / 8$ Input / Output Π·Π° 1 ΠΌΠ»Π½ ΡΠΎΠΊΠ΅Π½ΠΎΠ².
π Jamba 1.5 Mini - 0.2 $ / 0.4$ Input / Output Π·Π° 1 ΠΌΠ»Π½ ΡΠΎΠΊΠ΅Π½ΠΎΠ².
πΠΠΈΡΠ΅Π½Π·ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅: Jamba Open Model License
π’ΠΠ΅ΡΠΏΠ»Π°ΡΠ½ΠΎ Π΄Π»Ρ Π½Π΅ΠΊΠΎΠΌΠΌΠ΅ΡΡΠ΅ΡΠΊΠΈΡ
ΠΏΡΠΎΠ΅ΠΊΡΠΎΠ² ΠΈ Π»ΠΈΡΠ½ΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ
π ΠΠ΅ΡΠΏΠ»Π°ΡΠ½ΠΎ Π΄Π»Ρ ΠΊΠΎΠΌΠΌΠ΅ΡΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΏΡΠΈ Π³ΠΎΠ΄ΠΎΠ²ΠΎΠΌ Π΄ΠΎΡ
ΠΎΠ΄Π΅ Π΄ΠΎ 50 ΠΌΠ»Π½ USD, Π΅ΡΠ»ΠΈ Π±ΠΎΠ»ΡΡΠ΅ - Π·Π°ΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎΠ³ΠΎ Π΄ΠΎΠ³ΠΎΠ²ΠΎΡΠ°.
π‘Demo
#AI #Jamba #LLM #ML #SSM
1 ΠΌΠΈΠ½ΡΡΠ°
23Β Π°Π²Π³ΡΡΡΠ°Β 2024