В этой статье мы рассмотрим новую модель генерации текста, называемую OpenOrca. Orca - это проект Microsoft, который показал, что меньшая модель с 13 миллиардами параметров может превзойти большие модели, такие как GPT-3 или ChatGPT, на ряде задач, благодаря тщательному созданию набора данных. Microsoft пока не выпустила ни набор данных, ни модель Orca, но уже есть несколько открытых проектов, которые пытаются повторить результаты оригинальной статьи Orca. Один из таких проектов - это OpenOrca, который только что выпустил модель с 13 миллиардами параметров, обученную на наборе данных, который они называют Открытым набором данных Orca. Что такое OpenOrca? OpenOrca - это набор данных для обучения моделей генерации текста, который состоит из около 4 миллионов завершений GPT-4 и GPT-3.5. Завершения были получены с помощью специальных шаблонов запросов, которые имитируют различные типы системных сообщений или подсказок для пользователя. Например, один из шаблонов может быть таким: “Вы - ИИ-
OpenOrca: обзор новой модели генерации текста, основанной на методологии Орка
15 июля 202315 июл 2023
10
3 мин