Microsoft анонсировал малую языковую модель с открытым исходным кодом
Модель Phi-2 разрабатывается как часть серии Phi Small Language Model (SLM). Она создается как альтернатива большим языковых моделей (LLM) и будет использоваться в узких сферах, например, в научной деятельности.
Phi-2 имеет 2,7 миллиарда параметров, что в 650 раз меньше чем у GPT-4. Она соответствует всем актуальным на данный момент запросам отрасли, таким как здравый смысл, понимание языка и логическое рассуждение.
Размер Phi-2 позволит снизить затраты на ее использование. При этом модель должна точнее решать поставленные задачи из-за тщательно подобранного набора данных, использованных при обучении.
Исходный код модели будет открыт в ближайшее время.
—
@aioftheday — новости вокруг искусственного интеллекта
Около минуты
17 ноября 2023