Добавить в корзинуПозвонить
Найти в Дзене
RedStorm

Microsoft хотела доказать, что ИИ заменит людей, но случайно доказала обратное

Спойлер: нейросети оказались ужасными работниками. Они портят документы, выдумывают факты и не помнят, что делали 5 минут назад. Там создали тест DELEGATE-52 — 52 типовых задачи для офисных работников: разобрать документ по категориям, переформатировать, собрать обратно. Всё просто. Запустили 19 нейросетей (включая топовый GPT и Claude) и дали им 20 заданий подряд. Кошмар. Особенно весело, что нейросети не косячат понемногу, а внезапно убивают 10–30% работы за один провал. И так в 80% долгих сессий. Единственная профессия, где нейросети более-менее норм — написание кода на Python. Во всём остальном (бухгалтерия, музыка, субтитры, геналогия) — полный провал. Вывод Microsoft: нейросетям пока нельзя доверять работу без контроля. Они всё испортят. Другое исследование (от Workday) показало: Глава Workday сказал фразу, которая всё объясняет: «Слишком много сотрудников стали человеческой прослойкой между тупыми ИИ-системами». Люди не работают, а чинят то, что поломал искусственный интеллект.
Оглавление

Спойлер: нейросети оказались ужасными работниками. Они портят документы, выдумывают факты и не помнят, что делали 5 минут назад.

Что сделали в Microsoft

Там создали тест DELEGATE-52 — 52 типовых задачи для офисных работников: разобрать документ по категориям, переформатировать, собрать обратно. Всё просто.

Запустили 19 нейросетей (включая топовый GPT и Claude) и дали им 20 заданий подряд.

Что получилось

Кошмар.

  • Каждая четвёртая-пятая единица информации (25–50%) была потеряна или испорчена. Нейросеть тупо забывала важные данные.
  • Если не знала ответа — начинала выдумывать. Причём с каждым шагом ошибок становилось всё больше.
  • Уже через 20 «смен» даже самая умная модель сохраняла только 70–80% документа. Старые модели падали до 10–15%.

Особенно весело, что нейросети не косячат понемногу, а внезапно убивают 10–30% работы за один провал. И так в 80% долгих сессий.

Единственная профессия, где нейросети более-менее норм — написание кода на Python. Во всём остальном (бухгалтерия, музыка, субтитры, геналогия) — полный провал.

Вывод Microsoft: нейросетям пока нельзя доверять работу без контроля. Они всё испортят.

Но это не всё. Оказывается, время, которое ИИ «экономит», уходит на его же обслуживание

Другое исследование (от Workday) показало:

  • Каждый четвёртый сотрудник тратит 7 часов в неделю на то, чтобы перетаскивать данные между нейросетями и проверять их бред. Это почти целый рабочий день.
  • 80% офисных работников заняты ерундой: сначала ищут данные для нейросетки, а потом перепроверяют, что она нагаллюцинировала.
  • Команды спорят между собой, чьи цифры правильные, потому что ИИ выдал всем разный ответ.

Глава Workday сказал фразу, которая всё объясняет: «Слишком много сотрудников стали человеческой прослойкой между тупыми ИИ-системами».

Люди не работают, а чинят то, что поломал искусственный интеллект.

Итог: 77% работников — в стрессе и выгорают. Им кажется, что они заняты, но реальной пользы — ноль.

Вердикт

Microsoft доказала: долгосрочно доверять ИИ нельзя — он всё испортит.
Workday доказала: даже на простых задачах ИИ отнимает время, потому что системы не дружат между собой.

Похоже, легендарная шутка про «нас заменит не ИИ, а индусы» — не шутка. Пока нейросеть теряет 25% документа за час, живой человек из Индии спокойно сделает всё аккуратно и без галлюцинаций.

Не доверяйте нейросетям ничего важного. Всё.