Добавить в корзинуПозвонить
Найти в Дзене
Уроки по программированию

ChatGPT 4o-mini vs DeepSeek

Сегодня мы рассмотрим, сравним и столкнем лицом к лицу две самые популярные нейросети ChatGPT 4o-mini и DeepSeek. Их битва будет проходить по нескольким пунктам: умственные способности и понимание контекста, программирование, работа с изображениями, а также диалоги и взаимодействие. Прежде чем сталкивать их между собой, необходимо рассказать общую информацию про сегодняшних дуэлянтов. ChatGPT 4o-mini — это облегчённая версия модели GPT-4o, разработанная компанией OpenAI и выпущенная в мае 2024 года. Она создана на базе той же мультимодальной архитектуры, что и GPT-4o, где «о» означает omni — универсальность в обработке текста, изображений и аудио в рамках одной модели. Несмотря на компактность, 4o-mini демонстрирует высокую производительность, оставаясь быстрой, доступной и эффективной в плане затрат. DeepSeek-V2 и DeepSeek-Coder — это современные языковые модели, разработанные китайской компанией DeepSeek. Они представляют собой часть быстро развивающегося сегмента открытых ИИ-сис
Оглавление

Введение

Сегодня мы рассмотрим, сравним и столкнем лицом к лицу две самые популярные нейросети ChatGPT 4o-mini и DeepSeek. Их битва будет проходить по нескольким пунктам: умственные способности и понимание контекста, программирование, работа с изображениями, а также диалоги и взаимодействие.

1. Общая информация

Прежде чем сталкивать их между собой, необходимо рассказать общую информацию про сегодняшних дуэлянтов.

ChatGPT 4o-mini

ChatGPT 4o-mini — это облегчённая версия модели GPT-4o, разработанная компанией OpenAI и выпущенная в мае 2024 года. Она создана на базе той же мультимодальной архитектуры, что и GPT-4o, где «о» означает omni — универсальность в обработке текста, изображений и аудио в рамках одной модели. Несмотря на компактность, 4o-mini демонстрирует высокую производительность, оставаясь быстрой, доступной и эффективной в плане затрат.

DeepSeek

DeepSeek-V2 и DeepSeek-Coder — это современные языковые модели, разработанные китайской компанией DeepSeek. Они представляют собой часть быстро развивающегося сегмента открытых ИИ-систем, предназначенных как для общего использования, так и для специализированных задач программирования. Обе модели полностью открыты: доступны исходные коды, веса и обучающие пайплайны, что делает их особенно привлекательными для исследователей и разработчиков, стремящихся к прозрачности, модифицируемости и самостоятельному внедрению ИИ в проекты без зависимости от закрытых API.

DeepSeek-V2 была выпущена в мае 2024 года и представляет собой продвинутую языковую модель общего назначения. Она построена на архитектуре Transformer и существует в нескольких масштабах — 7B*, 16B и 64B параметров. Модель демонстрирует высокую производительность в задачах понимания, генерации текста, переводов, обобщения, а также в ряде мультиязычных задач, в том числе и на китайском языке, что делает её особенно полезной в азиатском регионе. DeepSeek-V2 стремится конкурировать с такими моделями, как GPT-4, Claude и Gemini, предоставляя при этом гораздо большую открытость.

DeepSeek-Coder, в свою очередь, был представлен в декабре 2023 года и ориентирован прежде всего на задачи программирования. Это специализированная модель для генерации и понимания кода, аналог Copilot, Code LLaMA или StarCoder, обученная на больших объёмах кода и сопутствующих технических текстов. Она также выпускается в масштабах 7B и 16B, с открытыми весами и возможностью дообучения. DeepSeek-Coder поддерживает множество языков программирования и способна писать, рефакторить, объяснять и дополнять код, а также решать задачи из области competitive programming и data science.

*B - бит

2. Умственные способности и понимание контекста

  • ChatGPT 4o-mini отлично понимает естественный язык, логично рассуждает, даёт краткие и точные формулировки, хорошо справляется с нестандартными вопросами и отлично отслеживает контекст в диалоге.
  • DeepSeek тоже показывает высокий уровень понимания и логики, особенно в 64B-варианте, но может иногда ошибаться на метафорах или в сложных логических цепочках. Контекст запоминает чуть хуже.

3. Программирование

  • ChatGPT 4o-mini хорошо справляется с Python, JavaScript и Java. Rust, C++ и Go поддерживает тоже неплохо. Объясняет код понятно, но длина кода ограничена контекстом. Multi-file проекты не поддерживает.
  • DeepSeek-Coder даёт отличные результаты по всем языкам, включая системные. Лучше справляется с длинными и многомодульными проектами. Есть поддержка multi-file input. Немного медленнее в генерации.

4. Работа с изображениями

  • ChatGPT 4o-mini умеет принимать изображения, распознавать текст, описывать, анализировать. Может генерировать изображения через API.
  • DeepSeek не поддерживает изображение ни на вход, ни на выход.*

*На момент написания статьи

5. Диалоги и взаимодействие

  • ChatGPT 4o-mini ведёт диалог дружелюбно и гибко. Хорошо переключается между темами, справляется с многопользовательскими ситуациями.
  • DeepSeek формален, местами суховат. Может «теряться» при резкой смене темы. Менее оптимизирован под реальное общение в чате.

(при определенном промте DeepSeek может очень грубо с вами говорить)

Вывод

Взглянув на результаты по вышеприведенным категориям можно подвести итог этой дуэли:

  • ChatGPT 4o-mini — лучший выбор для общения, понимания контекста, работы с изображениями и повседневного программирования.
  • DeepSeek — мощнее в техническом плане для крупных и сложных проектов с множеством файлов, но уступает в гибкости, диалогах и мультимодальности.

Однако у DeepSeek есть временный (надеемся) плюс. Для доступа к нему не требуются дополнительные ресурсы или программы.