Найти Ρ‚Π΅ΠΌΡƒ
10,2 тыс подписчиков

🌟 Jamba 1.5: БСмСйство ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ SSM-Transformer с большим контСкстным ΠΎΠΊΠ½ΠΎΠΌ.


AI21 Labs ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° Π² ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΌ доступС сСмСйство ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Jamba 1.5. МодСли ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ для использования Π² бизнСсС для Π·Π°Π΄Π°Ρ‡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Ρ€Π°Π±ΠΎΡ‡ΠΈΡ… процСссов RAG, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ возмоТностями Π²Ρ‹Π·ΠΎΠ²Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ, структурированного Π²Ρ‹Π²ΠΎΠ΄Π° (JSON) ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ тСкстовых Π΄Π°Π½Π½Ρ‹Ρ….

БСмСйство дСмонстрируСт Ρ…ΠΎΡ€ΠΎΡˆΡƒΡŽ ΡƒΠΏΡ€Π°Π²Π»ΡΠ΅ΠΌΠΎΡΡ‚ΡŒ Π² Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌ контСкстС, ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ ΠΈ качСство. Π­Ρ‚ΠΎ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ кСйс ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΠ³ΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Π½Π΅ трансформСрной ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎ уровня качСства Ρ‚ΠΎΠΏΠΎΠ²Ρ‹Ρ… ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

АрхитСктура Jamba состоит ΠΈΠ· Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½ΠΎΠ³ΠΎ сочСтания Transformers ΠΈ Mamba, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ мСньший объСм VRAM, Ρ‡Π΅ΠΌ трансформСрныС Π°Π½Π°Π»ΠΎΠ³ΠΈ ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ контСксты Π΄Π»ΠΈΠ½ΠΎΠΉ Π΄ΠΎ 140 тысяч Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½Π° ΠΎΠ΄Π½ΠΎΠΌ GPU Π² ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½Π½ΠΎΠΉ вСрсии.

Π§Ρ‚ΠΎΠ±Ρ‹ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡƒΠ΄ΠΎΠ±Π½Ρ‹ΠΌΠΈ Π² использовании, Π±Ρ‹Π»Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π° новая Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° квантования ExpertsInt8. Она ΠΊΠ²Π°Π½Ρ‚ΡƒΠ΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ вСса, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ‡Π°ΡΡ‚ΡŒΡŽ слоСв MoE, ΠΈ сохраняСт ΠΈΡ… Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ INT8.
ExpertsInt8 быстрСС Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² квантования, Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠΈ ΠΈ Π΄Π°Π΅Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ использования BF16 для хранСния Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ ΠΈ позволяСт Π·Π°Π³Ρ€ΡƒΠΆΠ°Ρ‚ΡŒ Large модСль Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΡƒΠ·Π»Π΅ ΠΈΠ· 8 GPU.


🟠total params - 399B;
🟠active non-embedding params - 94B;
🟠context - 256К.


🟒total params - 52B;
🟒active non-embedding params - 12B;
🟒context - 256К;
🟒Int8 context - 140К.

Запуск ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π²ΠΎΠ·ΠΌΠΎΠΆΠ΅Π½ Π½Π° ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ°Ρ… AI21 Studio, Google Cloud, Azure, Hugging Face, NVIDIA NIM.
ΠŸΡ€ΠΎΡ‚Π΅ΡΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ возмоТности ΠΎΠ±Π΅ΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ½Π»Π°ΠΉΠ½ Π² сСрвисС AI21 Studio .
ДоступСн Π²Ρ…ΠΎΠ΄ с Gmail ΠΈ Github, Π½Π° бСсплатный тСстовый ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ даСтся 10$ Π½Π° Ρ‚Ρ€ΠΈ мСсяца ΠΏΡ€ΠΈ Ρ‚Π°Ρ€ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ:

🟠Jamba 1.5 Large - 2 $ / 8$ Input / Output Π·Π° 1 ΠΌΠ»Π½ Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ².
🟠Jamba 1.5 Mini - 0.2 $ / 0.4$ Input / Output Π·Π° 1 ΠΌΠ»Π½ Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ².

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Jamba Open Model License

πŸŸ’Π‘Π΅ΡΠΏΠ»Π°Ρ‚Π½ΠΎ для нСкоммСрчСских ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² ΠΈ Π»ΠΈΡ‡Π½ΠΎΠ³ΠΎ использования
πŸŸ Π‘Π΅ΡΠΏΠ»Π°Ρ‚Π½ΠΎ для коммСрчСского использования ΠΏΡ€ΠΈ Π³ΠΎΠ΄ΠΎΠ²ΠΎΠΌ Π΄ΠΎΡ…ΠΎΠ΄Π΅ Π΄ΠΎ 50 ΠΌΠ»Π½ USD, Ссли большС - Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π΄ΠΎΠ³ΠΎΠ²ΠΎΡ€Π°.

🟑Demo


#AI #Jamba #LLM #ML #SSM
1 ΠΌΠΈΠ½ΡƒΡ‚Π°