Обучение модели V3 DeepSeek заняло два месяца, на что ушло 5,58 млн долларов США, при этом было использовано значительно меньше вычислительных ресурсов, чем у конкурентов. Выпуск новой большой языковой модели (LLM) китайским стартапом DeepSeek произвел фурор в мировой индустрии искусственного интеллекта (ИИ), поскольку тесты показали, что она превзошла конкурирующие модели от таких компаний, как Meta Platforms и создатель ChatGPT OpenAI . Компания из Ханчжоу сообщила в четверг в сообщении WeChat, что ее одноименная модель LLM DeepSeek V3 имеет 671 миллиард параметров и была обучена примерно за два месяца стоимостью 5,58 миллиона долларов США, используя значительно меньше вычислительных ресурсов, чем модели, разработанные более крупными технологическими компаниями. LLM относится к технологии, лежащей в основе генеративных служб ИИ, таких как ChatGPT. В ИИ большое количество параметров имеет решающее значение для того, чтобы LLM мог адаптироваться к более сложным шаблонам данных и делать
DeepSeek запускает ИИ, превосходящий Meta и OpenAI
28 декабря 202428 дек 2024
28
3 мин