23,5K подписчиков

Болтливая модель: как YaLM делает сервисы Яндекса лучше

343 прочитали
История о том, как нейросетевая модель-трансформер работает в сервисах Яндекса.

История о том, как нейросетевая модель-трансформер работает в сервисах Яндекса.

Мы уже рассказывали, как развивались первые чат-боты и как им на смену пришли большие языковые модели, а также — как в Яндексе учили русскому языку модель YaLM (Yet another Language Model). Но разработать модель — это только половина дела. Следующий этап — отшлифовать её, чтобы затем доверить взаимодействие с пользователями и использовать в сервисах. Рассказываем, как модель улучшила Поиск и Алису и где ещё можно применить её способности. Читайте дальше.