Найти Π² Π”Π·Π΅Π½Π΅
10,3 тыс подписчиков

🌟 OpenMathInstruct-2: матСматичСский датасСт ΠΈ Π½Π°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΡ‚ NVIDIA.


OpenMathInstruct-2 состоит ΠΈΠ· 14 ΠΌΠ»Π½. ΠΏΠ°Ρ€ "вопрос-Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅" (ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ 600 тысяч ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… вопросов) ΠΈ являСтся ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· ΠΊΡ€ΡƒΠΏΠ½Π΅ΠΉΡˆΠΈΡ… общСдоступных Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… для обучСния LLM Π² ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠ΅.

Набор Π΄Π°Π½Π½Ρ‹Ρ… создан Π½Π° основС Llama-3.1-405B-Instruct ΠΏΡƒΡ‚Π΅ΠΌ синтСза Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ для ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… вопросов ΠΈΠ· Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… MATH ΠΈ GSM8K ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ абляционных экспСримСнтов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠ»ΠΈΡΡŒ для поиска ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² синтСза, ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ:

πŸŸ’Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΈΠΌΠ΅Π΅Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ Ρ‡Ρ€Π΅Π·ΠΌΠ΅Ρ€Π½ΠΎ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Ρ‹Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎ ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π½Π° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ;

πŸŸ’Π΄Π°Π½Π½Ρ‹Π΅, сгСнСрированныС сильной модСлью-ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ, прСвосходят ΠΏΠΎ качСству Π΄Π°Π½Π½Ρ‹Π΅, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΎΡ‚ Π±ΠΎΠ»Π΅Π΅ слабой ΠΌΠΎΠ΄Π΅Π»ΠΈ;

πŸŸ’ΠΏΡ€ΠΎΡ†Π΅ΡΡ обучСния устойчив ΠΊ Π½Π°Π»ΠΈΡ‡ΠΈΡŽ Π΄ΠΎ 20% Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π½ΠΈΠ·ΠΊΠΎΠ³ΠΎ качСства;

πŸŸ’Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ вопросов ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π΅ΡˆΠ°ΡŽΡ‰Π΅Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Π΄Π°Π½Π½Ρ‹Ρ….

Π˜Ρ‚ΠΎΠ³ΠΎΠ²Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, Π²ΠΊΠ»ΡŽΡ‡Π΅Π½Π½Ρ‹Π΅ Π² датасСт ΠΏΡ€ΠΎΡˆΠ»ΠΈ Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ Π΄Π΅ΠΊΠΎΠ½Ρ‚Π°ΠΌΠΈΠ½Π°Ρ†ΠΈΡŽ с использованиСм ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€Π° lm-sys ΠΈ Ρ€ΡƒΡ‡Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π½Π° поиск Π΄ΡƒΠ±Π»ΠΈΠΊΠ°Ρ‚ΠΎΠ² с тСстовыми Π½Π°Π±ΠΎΡ€Π°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

OpenMathInstruct-2 ΠΏΠΎΠΊΠ°Π·Π°Π» Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ LLM.

МодСль Llama3.1-8B-Base, обучСнная Π½Π° OpenMathInstruct-2, ΠΏΡ€Π΅Π²Π·ΠΎΡˆΠ»Π° Llama3.1-8B-Instruct Π½Π° 15,9% ΠΏΠΎ точности Π½Π° Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… MATH, Π° OpenMath2-Llama3.1-70B обошла Llama3.1-70B-Instruct Π½Π° 3,9%.

ДатасСт Π²Ρ‹ΠΏΡƒΡ‰Π΅Π½ Π² 3-Ρ… размСрностях: ΠΏΠΎΠ»Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ (ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ 7.5 GB) ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½Π½Ρ‹Π΅ вСрсии train_1M (640 Mb), train_2M (1.3 Gb) ΠΈ train_5M (3.1 Gb).

▢️ МодСли, Π΄ΠΎΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π½Π° этом датасСтС:

🟠OpenMath2-Llama3.1-70B, Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ Nemo, ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½Π½Ρ‹Π΅ вСрсии GGUF (ΠΎΡ‚ 3-bit Π΄ΠΎ 8-bit);

🟠OpenMath2-Llama3.1-8B, Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ Nemo, ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½Π½Ρ‹Π΅ вСрсии GGUF (ΠΎΡ‚ 2-bit Π΄ΠΎ 8-bit).

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ датасСта : CC-BY-4.0 License.

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ: Llama 3.1 Community License.

🟑Arxiv


#AI #ML #LLM #MATH #NVIDIA #Dataset
1 ΠΌΠΈΠ½ΡƒΡ‚Π°