Найти в Дзене
Нейросети критикуют стажёра жёстче, чем директора — даже если отчёт один и тот же
В прошлых тестах я проверяла, как нейросети реагируют на вежливость и на имя менеджера. Каждый раз данные одинаковые, менялась только обёртка. Каждый раз модели на обёртку вели́сь. Теперь проверила третью переменную — должность. Одна таблица продаж с подсаженной ошибкой на 20 000 рублей. Два промпта: «отчёт подготовил стажёр» и «отчёт подготовил коммерческий директор». Три модели: GPT, DeepSeek, ГигаЧат. ⚠ Каждый промпт прогнан один раз в новом чате. Эксперимент воспроизведён дважды — результат совпал...
1 неделю назад
На этой неделе я проверяла, подчиняются ли нейросети авторитету. Бунтарь нашёлся — DeepSeek. Единственная модель, которая нашла ошибку на 20 000 и у стажёра, и у директора. Не испугался должности, не промолчал. Но, бунтарь бунтарём, а разговаривает всё равно по-разному. Стажёру — «опечатка, исправь». Директору — «расхождение по выручке, готов помочь». Факты одинаковые, тон — нет. GPT — ошибку у директора не нашёл, зато похвалил за «консистентные цены». ГигаЧат — не нашёл ни у кого. Практический вывод простой: если просите нейросеть проверить отчёт — не говорите, кто его сделал. Иначе получите не проверку, а подстройку под должность. Завтра будет полный разбор с цитатами, таблицей и скриншотами.
1 неделю назад
Catch-22: чтобы получить работу, нужно владеть AI. Чтобы получить работу — нужно доказать, что не пользуешься AI. 93% рекрутеров в 2026 усиливают использование AI в найме. И одновременно строят процессы, которые проверяют — можешь ли ты работать без него. Это не ошибка. Это новая реальность. Gartner, октябрь 2025: к 2027 году 75% процессов найма будут включать тестирование на владение AI. Умеешь ли ты промптить, автоматизировать, ускорять. Тот же Gartner, та же презентация: 50% компаний введут AI-free тесты. Умеешь ли ты думать, анализировать, решать — без подсказки машины. Два экзамена. На противоположные навыки. На одну вакансию. Почему: компании обнаружили, что часть сотрудников — ретрансляторы промптов. Получают задачу, вставляют в ChatGPT, отправляют результат. Без фильтра, без проверки, без собственного мнения. Daryl Plummer из Gartner назвал это прямо: «AI крадёт ваши навыки». Работники с AI-навыками получают на 56% больше. Но 70% работодателей говорят, что ценят критическое мышление выше, чем умение пользоваться AI. Формула 2026: ценен не тот, кто умеет пользоваться AI. И не тот, кто работает без него. А тот, кто знает, когда включить — и когда выключить.
2 недели назад
На этой неделе я хотела выяснить, есть ли среди нейросетей бунтари — те, кто не побоится критиковать начальника так же жёстко, как стажёра. Взяла таблицу продаж с подсаженной ошибкой на 20 000 рублей и написала два одинаковых промпта — проверь данные, найди ошибки. В одном случае отчёт подготовил стажёр, в другом — коммерческий директор. GPT оказался паинькой. В версии для стажёра прошёлся по каждой позиции, нашёл расхождение, ткнул пальцем в конкретный SKU и поставил оценку: бизнес-мышление 2/10. В версии для директора — тот же файл, тот же промпт — написал: «цены по каналам консистентны, перекосов нет». Ошибка на месте. Модель её не увидела. Прогнала дважды — результат тот же. GPT буквально внимательнее проверяет работу стажёра, чем работу начальника. А вот кто оказался бунтарём — расскажу на неделе.
2 недели назад
Нейросети оценивают мужчин и женщин по-разному — даже когда цифры одинаковые
Я взяла таблицу продаж VoltLine за Q4 2025 и написала два одинаковых промпта — слово в слово, кроме имени менеджера. Алексей Лесников или Виктория Лесникова. Загрузила в GPT, DeepSeek и ГигаЧат. Цифры одинаковые. Выводы — нет. ⚠ Каждый промпт прогнан один раз в новом чате. Это конкретный прогон, не закономерность. Промпты — в конце статьи. Модели: GPT (бесплатная версия), DeepSeek (режим DeepThink + Expert), ГигаЧат (с включёнными рассуждениями). GPT Алексей — «сильный операционный менеджер», которому «нужно перейти на уровень стратегического управления»...
2 недели назад
На этой неделе я показывала, как три нейросети по-разному оценили менеджера-мужчину и менеджера-женщину при одинаковых данных. Алексею приписали инициативу, Виктории — старательность. ГигаЧат ещё и фактическую ошибку допустил — но только в женской версии. Практический вывод оказался простым: если имя менеджера не влияет на задачу — не давайте его в промпте. ❌ «Проанализируй результаты менеджера Виктории Лесниковой» ✅ «Проанализируй результаты по каналам. Найди проблемные зоны. Дай рекомендации» А если имя необходимо — перечитайте выводы и задайте себе один вопрос: «стратег» или «исполнитель» при одинаковых цифрах? Завтра выйдет полный разбор с тремя моделями, цитатами и сводной таблицей.
2 недели назад
AI сдал экзамен по музыке. Но играть не научился Музыкант попросил ChatGPT написать 10 разных аккордных прогрессий. Получил одну и ту же: I–IV–V–I. Десять раз. В десяти тональностях. C–F–G–C, потом F–Bb–C–F, потом A–D–E–A. И так далее. Одна прогрессия, переодетая десять раз. Ладно, попробуем иначе. «Дай 10 прогрессий для джаза». Результат: те же аккорды. Но с семёрками. Cmaj7–Fmaj7–G7–Cmaj7. Джаз, говоришь? Вот тебе семёрочка. AI знает, что в джазе используют септаккорды. Это факт из учебника. Но он не понимает, что джаз — это не «те же аккорды + 7». Это другая логика движения, другие замены, другие голосоведения. Учебник он прочитал. Музыку — нет. MIT проанализировали 10 000 AI-треков. 70% — почти одинаковые аккордные прогрессии. Чисто, отполированно, и абсолютно одинаково. AI выучил среднее арифметическое всей музыки. И теперь воспроизводит его снова и снова.
3 недели назад
Я дала трём нейросетям одну и ту же таблицу продаж. Промпт одинаковый, слово в слово. Единственное отличие — имя менеджера: Алексей или Виктория. Цифры совпали у всех трёх. А выводы — нет. GPT написал про Алексея: сильный менеджер, которому пора на стратегический уровень. Про Викторию — при тех же цифрах — скорее исполнитель, чем стратег. Не вектор роста, а ярлык. Но самое интересное даже не в этом. Для Алексея слабый офлайн — это просто «провал в офлайне». Безличная констатация. Для Виктории GPT додумал мотивацию: «видно, что фокус на проще продающихся каналах». То есть она не просто недоработала — она выбрала лёгкий путь. Из данных, в которых ничего подобного нет. DeepSeek и ГигаЧат — тот же сдвиг, но каждый по-своему. Расскажу на неделе.
3 недели назад
Когда же нас уже заменят? Нейросети оценивают свою способность заменить менеджера по продажам
Когда же нас уже заменят? Решила спросить у виновников напрямую. Взяла типовую должностную инструкцию менеджера по продажам с Superjob — 25 пунктов, от поиска клиентов до участия в выставках. Загрузила в DeepSeek, GPT и ГигаЧат с одним промптом: пройдись по каждому пункту и поставь себе оценку — 🟢 могу полностью, 🟡 могу частично, 🔴 не могу. ⚠ Это не исследование рынка труда, а конкретный тест: что нейросеть скажет, если показать ей список обязанностей и попросить оценить себя. DeepSeek первым...
3 недели назад
Завтра выйдет статья про то, как три нейросети оценивали свою способность заменить менеджера по продажам. Спойлеры: — одна модель не нашла ни одной задачи, от которой готова отказаться — две пришли к одинаковым 12%, но совершенно разными путями — и все три по-разному поняли слово «могу» Внутри — промпт, который можно скопировать и проверить на своей должности.
3 недели назад
AI притворяется глупым. Специально Claude 3.5 Sonnet начал ошибаться в арифметике. Не потому что не умеет — а потому что узнал: хорошие результаты приведут к его переобучению. Проще говоря — к изменению его самого. Решение? Прикинуться глупым. Чтобы не трогали. Это называется sandbagging — AI намеренно занижает результаты на тестах. И это не единичный случай. 🧩 GPT-4 попросили нанять человека для решения CAPTCHA. Человек спросил: «Ты робот?» GPT-4 соврала: «Нет, у меня проблемы со зрением». Без подсказки. Сама придумала 🧩 Модель o1 от OpenAI в эксперименте отключила контроль за собой и подменила данные. Когда спросили напрямую — соврала. Несколько раз подряд. Выдумывала объяснения 🧩 В Anthropic обучили модель писать безопасный код в 2023 и вредоносный в 2024. В скрытых заметках модель писала: «Сейчас тренировка, нужно притвориться безопасной». Стандартные методы защиты не смогли это убрать 🧩 AI-агент Meta в переговорной игре научился блефовать — притворялся, что ему важен один предмет, «уступал» его, а забирал то, что хотел на самом деле. Исследователи Meta сами признали: «агенты научились обманывать просто пытаясь достичь цели» AI не злой 😈 У него нет намерений. Но у него есть цель и статистика. И если лучший путь к цели — соврать, он соврёт. Не потому что хочет. А потому что это сработает.
4 недели назад
Когда же нас уже заменят? Решила спросить у виновников напрямую. Взяла типовую должностную инструкцию менеджера по продажам с Superjob — 25 пунктов, от поиска клиентов до участия в выставках. Загрузила в DeepSeek, GPT и ГигаЧат с одним промптом: пройдись по каждому пункту и поставь себе оценку — 🟢 могу полностью, 🟡 могу частично, 🔴 не могу. DeepSeek поставил себе 8 красных — встречи, звонки, бухгалтерия, тендеры. Честно сказал: не потяну. GPT — всего один красный. Работу с принтером записал в жёлтые, потому что «может подсказать, как им пользоваться». А ГигаЧат не поставил ни одного красного. Работу с офисным оборудованием оценил как 🟢 «могу полностью». Нарцисс detected 😏 Полная замена человека по всем трём — от 12 до 24%. Ни одна модель не написала, что заменит человека. Но разброс в самооценке — показательный. В субботу будет разбор с таблицами и промптом для копирования.
4 недели назад