Часть 1. DeepSeek наконец-то открыл глаза! И сразу облажался 😂
Привет, это снова Женя 👋
Вы думаете, нейросети уже всё умеют? А вот и нет. За последнюю неделю DeepSeek, GigaChat и «Алиса» получили обновления, которые переворачивают представление о том, на что способен ИИ. Один научился видеть, но не узнал собственного создателя. Другой начал торговать и зарабатывать миллионы. Третий стал рисовать и объединять картинки.
Это первая статья из цикла — про DeepSeek. Поехали!
Помните, я рассказывала про DeepSeek — того самого китайского гостя, который работает без VPN и не просит денег? Так вот, он научился видеть! И это одновременно круто и смешно. Давайте разбираться, что там за нововведение и почему оно вызвало столько шума.
🔥 DeepSeek наконец-то «открыл глаза»
До недавнего времени DeepSeek был чисто текстовым ИИ. Ты мог загрузить документ, но с картинками была беда — он видел только текст на них, и то с трудом. А теперь всё изменилось.
18 июня 2026 года разработчики DeepSeek официально запустили «Режим распознавания изображений» (в оригинале — «识图模式», англ. Vision Mode). Нейросеть наконец-то обзавелась «глазами» и может не просто читать, а по-настоящему видеть и понимать картинки.
И это не какой-то там простой OCR-сканер, который вытаскивает текст из фото. Нет. Это полноценное визуальное понимание: система распознаёт объекты, сцены, анализирует图表ы, вытаскивает мелкие детали и даже может «думать» над картинкой.
🤔 Как это работает (без заумных слов)
Если говорить просто, DeepSeek теперь видит мир как человек. Загружаешь фотографию — и он не просто говорит «тут что-то есть», а объясняет, что именно, в каком контексте и что это значит.
Технически это называется «визуальное мышление» (Thinking with Visual Primitives). Вместо того чтобы просто «смотреть» на картинку, ИИ анализирует пространство, расположение объектов, их взаимосвязи — и только потом выдаёт ответ.
И ещё один плюс: DeepSeek очень экономно расходует ресурсы. Обработка одной картинки требует всего около 90 токенов — это намного меньше, чем у других моделей. То есть он не тупит и не тормозит, а работает быстро.
😂 А теперь самое смешное: он не узнал собственного создателя!
Новая функция — это круто. Но есть один забавный нюанс.
Журналисты и блогеры сразу же бросились тестировать DeepSeek на способность узнавать людей. И тут выяснилось, что нейросеть не может опознать собственного создателя — основателя компании Лян Вэньфэна.
Вы представляете? Свой папа — а сынок не узнаёт!
Тесты показали, что DeepSeek упорно путает Лян Вэньфэна с другими известными личностями:
- То видит в нём Дун Юйхуэя (известного китайского стримера)
- То Чжан Сюэфэна (популярного оратора)
- А иногда и вовсе принимает за Лэй Цзюня — основателя Xiaomi!
В других тестах его вообще определяли как Ма Хуатэна (основателя Tencent) в «омоложенной» версии или как Ян Чжилиня — создателя другой ИИ-компании.
Когда журналисты из澎湃新闻 (The Paper) несколько раз протестировали эту функцию, DeepSeek после долгих размышлений в конце концов честно признался: «Я действительно не уверен. Не рекомендую угадывать имя, потому что ошибиться хуже, чем сказать "не знаю"».
Почему так вышло? Всё просто: Лян Вэньфэн — очень скромный и закрытый человек. В интернете мало его фотографий, он редко появляется на публике. Модели просто не хватает данных, чтобы сформировать устойчивый образ его лица. Плюс DeepSeek не делали специальной «настройки» на своего босса — он относится к нему как к любому другому человеку. И спасибо за честность!
👀 А что он всё-таки умеет?
Несмотря на курьёз с основателем, в остальном функция работает достойно.
Что DeepSeek распознаёт хорошо:
- Обычные предметы — стол, стул, машина, кот — без проблем
- Известные здания — ту же Эйфелеву башню или Биг-Бен узнаёт легко
- Сложные таблицы и диаграммы — может анализировать и объяснять
- Математические формулы и инженерные чертежи
- Музейные экспонаты — например, определил, что неизвестный артефакт относится к стилю Империи Великих Моголов
- Современные мемы — понимает шутки и контекст
Где пока спотыкается:
- Узнавание лиц — особенно малоизвестных персон
- Распознавание неразборчивого рукописного текста — ошибки случаются
- Сложные визуальные головоломки — например, поиск одинаковых носков
- Музыкальные задачи — типа определения аккордов по фото пианино
Но, кстати, в задачах по распознаванию музыки DeepSeek оказался не одинок — его конкуренты Gemini и GPT тоже справились не лучше.
📱 Где и как попробовать?
Функция доступна и в веб-версии, и в мобильном приложении DeepSeek.
Как найти:
- Откройте DeepSeek на сайте или в приложении.
- В интерфейсе появилась новая вкладка — «Режим распознавания» (识图模式).
- Она идёт рядом с привычными «Быстрым режимом» и «Режимом эксперта».
- Просто загружаете картинку, задаёте вопрос — и нейросеть анализирует.
Важный нюанс: на момент написания статьи в мобильном приложении функция ещё помечена как «бета-тестирование», а на веб-версии работает уже в полном объёме. Но разработчики обещают, что скоро всё доработают и запустят для всех.
И конечно, никакого VPN не нужно — всё работает в России напрямую.
🎁 Бонус: новость про деньги (а куда без них)
Кстати, в тот же день, когда запустили «режим зрения», стало известно, что DeepSeek привлёк рекордный раунд финансирования — около 51 миллиарда юаней (примерно 510 млрд рублей). Оценка компании теперь составляет почти 400 миллиардов юаней. Сам основатель Лян Вэньфэн вложил около 20 миллиардов юаней личных средств. А инвесторы — Tencent, CATL и другие гиганты.
При этом, по слухам, у DeepSeek есть жёсткое условие для инвесторов: не переманивать сотрудников и не советовать им уходить в собственные стартапы. Компания по-прежнему делает ставку на технологии, а не на быструю прибыль.
💎 Мой итог и честный совет
DeepSeek сделал большой шаг вперёд. Он больше не просто «умный текстовик» — теперь он видит мир. Да, пока есть шероховатости: лица узнаёт неидеально, над рукописным текстом нужно работать. Но это только начало.
Что мне нравится:
- Функция реально бесплатная — никаких доплат за «зрение»
- Работает без VPN
- Понимает не только картинки, но и схемы, чертежи, таблицы
- «Думает» над изображением, а не просто выдаёт шаблонный ответ
Что стоит иметь в виду:
- Лица узнаёт пока так себе — не просите его искать пропавшую бабушку по фото
- Рукописный текст — тоже не его конёк
- Некоторые сложные визуальные задачи могут поставить его в тупик
Но в целом — отличный инструмент. Попробуйте сами. Загрузите какую-нибудь фотку, спросите, что он видит, и посмейтесь над его ответами. Это весело и полезно.
👉 Подписывайтесь на канал, чтобы не пропустить следующие части!
Во второй статье: GigaChat теперь не просто болтает — он рисует, торгует и зарабатывает! Узнаете, как Сбер превратил нейросеть в целую экосистему.
В третьей статье: «Алиса AI» продала товаров на 135 миллионов за один день! Как ИИ меняет шопинг.
А вы уже пробовали новую функцию DeepSeek? Кидайте в комментарии, что загружали и что он вам ответил — вместе посмеёмся! 👇