Найти тему

Ну и, наконец, гвоздь программы - обучение LLM. Важно понимать, что ChatGPT на тот момент еще не было. Проект длился около 3-4 месяцев, был проделан огромный объем работы. В качестве основы была взята открытая модель с миллиардом параметров, моей задачей было дообучить ее так, чтобы она могла сочинять внятные тексты, стихи, песни и все то, что на старте умел ChatGPT. Когда OpenAI его зарелизили и еще и дали API, смысла продолжать работу над нашей моделью уже не было, нужно было делать другую модель - более мощную. В тот момент я стал руководителем направления R&D и на нашу команду легла огромная ответственность по разработке LLM-модели, о которой впоследствии написал Forbes(!). Под командой я имею в виду трех человек, каждый из которых работал за двоих. ⚡️⚡️⚡️В сентябре 2023 свет увидел JustGPT - третью в России коммерческую LLM модель (после Яндекса и Сбера).


Очень горжусь командой и работой, которую нам удалось проделать в рекордно короткие сроки!

Ставьте 🔥, если история вам зашла, и я пойму, что иногда стоит делиться подобным контентом!

#путьКотика
Около минуты