Найти тему

Microsoft анонсировал малую языковую модель с открытым исходным кодом


Модель Phi-2 разрабатывается как часть серии Phi Small Language Model (SLM). Она создается как альтернатива большим языковых моделей (LLM) и будет использоваться в узких сферах, например, в научной деятельности.

Phi-2 имеет 2,7 миллиарда параметров, что в 650 раз меньше чем у GPT-4. Она соответствует всем актуальным на данный момент запросам отрасли, таким как здравый смысл, понимание языка и логическое рассуждение.

Размер Phi-2 позволит снизить затраты на ее использование. При этом модель должна точнее решать поставленные задачи из-за тщательно подобранного набора данных, использованных при обучении.

Исходный код модели будет открыт в ближайшее время.


@aioftheday — новости вокруг искусственного интеллекта
Около минуты