Компания DeepSeek из Китая представила новую языковую модель с открытым исходным кодом — DeepSeek V3 (https://chat.deepseek.com/). В отличие от многих других моделей, она доступна для свободного использования, в том числе в коммерческих проектах. DeepSeek V3 показала себя лучше других языковых моделей в большинстве основных тестов. Результаты тестов вверху 👆. Особенно хорошо она справляется с задачами, связанными с программированием. DeepSeek V3 также является самой крупной моделью с открытым исходным кодом на сегодняшний день по количеству параметров — 671 миллиард. Предыдущий лидер, Llama 3.1, имеет только 405 миллиардов параметров. Такой объём параметров позволяет модели лучше понимать контекст и решать более сложные задачи, но это требует больших вычислительных ресурсов. Для работы с приемлемой скоростью модели необходимо мощное оборудование.