Обучение продвинутых больших языковых моделей искусственного интеллекта, таких как ChatGPT компании OpenAI и Gemini Ultra от Google, требует миллионов долларов, причем затраты быстро растут.
На инфографике, представленной выше, показан рост затрат на обучение моделей искусственного интеллекта, основанный на отчете Стэнфордского университета за 2024 год.
В прошлом году стоимость обучения GPT-4 оценивалась в 78,4 миллиона долларов, что значительно превышает стоимость модели PaLM (540B) от Google , которая стоила 12,4 миллиона долларов всего годом ранее.
Для сравнения: стоимость обучения Transformer, ранней модели искусственного интеллекта, разработанной в 2017 году, составила всего 930 долларов. Кстати, эта модель играет основополагающую роль в формировании архитектуры многих крупных языковых моделей, используемых сегодня.
Модель искусственного интеллекта Google Gemini Ultra стоит еще дороже — ошеломляющие 191 миллион долларов. По состоянию на начало 2024 года модель превосходит GPT-4 по нескольким показателям, в первую очередь по тесту массового многозадачного понимания языка (MMLU). Этот тест служит важнейшим критерием для оценки возможностей больших языковых моделей. Например, он известен тем, что оценивает знания и навыки решения проблем в 57 предметных областях.
Учитывая эти проблемы, компании, занимающиеся искусственным интеллектом, находят новые решения для обучения языковых моделей и для борьбы с растущими затратами.
Они включают в себя ряд подходов, таких как создание моделей меньшего размера, предназначенных для выполнения конкретных задач. Другие компании экспериментируют с созданием собственных синтетических данных для использования в системах искусственного интеллекта. Однако явного прорыва пока не видно.