4 видеокарты. Третья большая LLM в России — JustGPT 2023 год. CEO Just AI зашёл и сказал: «Костя, нам нужна своя большая русскоязычная LLM. Третья в стране — после Яндекса и Сбера». В команде нас было трое, включая меня. Двое других уже на других проектах. Собственных GPU — четыре RTX 4090. Звучало абсурдно. Согласился. Как выкрутились: 🔸 Не учили модель с нуля. Взяли Llama 2 на 70B — лучшую открытую модель момента — и адаптировали её под русский. Без чистки она продолжала выдавать «разогрейку» вместо «разогрева» и «амиusing» среди синонимов к «смешной». 🔸 Своих 4090 не хватало даже близко, только для отладки пайплайна на меньших версиях модели. Арендовали A100 на Selectel и прогнал на них пайплайн обучения 70B. 🔸 Полный файнтюн в наших сроках был исключён. Использовал LoRA-адаптеры — не трогаем веса базы, обучаем параллельные матрицы низкого ранга. Это физически позволило проекту состояться. 🔸 За данные — спасибо команде и лингвистам Just AI: инструктивные датасеты, фильтров