Компания Bytedance, владелец социальной сети TikTok, использовала технологии OpenAI для ускорения разработки своего конкурента GPT. Об этом сообщает издание The Verge, ссылаясь на внутренние документы компании. В рамках проекта, названного Project Seed, Bytedance обращалась к API OpenAI на различных этапах разработки своего крупного языкового моделя (LLM).
Использование API OpenAI для разработки конкурирующих моделей противоречит условиям использования сервиса. В ответ на это OpenAI временно заблокировала доступ Bytedance к своему API, заявив, что будет проводить дальнейшее расследование. По словам представителя OpenAI Нико Феликса, если подтвердится нарушение правил, доступ Bytedance может быть окончательно аннулирован.
Согласно утечке, Bytedance активно использовала GPT-генерированные тексты, особенно на начальном этапе разработки своего LLM. Внутренние документы указывают на обсуждение среди сотрудников возможностей скрыть этот факт. Также сообщается, что Bytedance имела лицензию от Microsoft на использование GPT-APIs.
По мнению экспертов, такая практика распространена среди небольших компаний, но нехарактерна для крупных игроков, как Bytedance. Это указывает на высокий уровень давления на разработчиков для создания конкурента GPT. По планам Bytedance, их модель LLM с 200 миллиардами параметров должна быть готова к середине 2024 года, в то время как GPT3.5 имеет 175 миллиардов параметров.