Найти в Дзене
Зачем мы такие?

Человек и ИИ: где этот союз даёт выгоду и в чём его ограничения?

Оглавление

Автор — Алиса Годованец

Современный мир всё активнее использует искусственный интеллект — от медицины и финансов до повседневных сервисов. Принято считать, что люди обладают контекстным мышлением и творческой интуицией, а машины — колоссальной скоростью анализа больших данных. На первый взгляд кажется логичным, что при совместной работе их потенциалы объединяются и позволяют достичь результатов, которые в одиночку не доступны ни человеку, ни ИИ. Однако крупномасштабное исследование, опубликованное в журнале Nature Human Behaviour осенью 2024 года, показало неожиданный результат: сотрудничество «человек+ИИ» не всегда приводит к более высоким показателям, чем работа только человека или только ИИ.

Анализ предыдущих работ и задачи исследования

Цель работы заключалась в том, чтобы систематически оценить, действительно ли союз «человек+ИИ» даёт два ключевых эффекта, на которые часто рассчитывают:

  1. Human augmentation (усиление человека): когда человек, пользуясь подсказками или помощью ИИ, демонстрирует результаты выше, чем человек без поддержки ИИ.
  2. Human–AI synergy (синергия человека и ИИ): когда союз «человек+ИИ» обходит не только самого человека, но и сам ИИ, если их рассматривать по отдельности.

Долгое время в научном поле существовало множество отдельных экспериментов: одни утверждали, что интеграция интеллектуальных систем повышает точность и скорость решений, другие показывали, что люди часто недооценивают или переоценивают предложения искусственного интеллекта, снижая итоговую эффективность. Авторы этого нового исследования решили проанализировать ситуацию максимально широко, проведя мета-анализ (сводную статистическую оценку) работ, опубликованных с 1 января 2020 по 30 июня 2023 года в международных базах ACM Digital Library, Web of Science и AIS eLibrary. Ключевым критерием включения была необходимость прямого сопоставления трёх вариантов: (1) работа только человека, (2) работа только ИИ, (3) комбинация человека и ИИ — причём в каждой статье должно было быть представлено количественное сравнение показателей этих трёх условий (точность, качество, скорость и др.)

После отбора и тщательной проверки авторы собрали массив из 74 статей, в которых содержалось 106 уникальных экспериментов. При этом общим счётом удалось выявить 370 «эффектов» (effect sizes), позволяющих сравнить, в какой степени комбинация человека и ИИ улучшает или ухудшает результаты по сравнению с одиночным исполнителем. Чтобы свести воедино столь разные исследования (где варьировались задачи, условия эксперимента и сами способы оценки), учёные применили трёхуровневую модель мета-анализа и показатель Hedges’ g — универсальную метрику, позволяющую переводить разные индикаторы (точность, уровень ошибок, качество и т. п.) в сопоставимую шкалу.

Основные выводы исследования

Первое, что установили авторы: human augmentation действительно прослеживается. Если сравнивать «человек+ИИ» и «человек без ИИ», то средняя оценка Hedges’ g = 0.64 (при статистически значимом уровне), что соответствует «средне-крупному» размеру эффекта. Иначе говоря, люди в большинстве экспериментов получают выгоду от использования алгоритмов. Если у человека есть возможность сверяться с подсказками ИИ и вносить корректировки, он работает точнее и быстрее, чем при тех же задачах без поддержки интеллектуальных систем.

Однако, если посмотреть на human–AI synergy — то есть проверку, обходит ли союз «человек+ИИ» и человека, и машину, — общие итоги не столь радужны. Средний Hedges’ g = -0.23, причём это небольшое, но статистически значимое отрицательное значение. Результаты исследования показывают, что в среднем «гибрид» уступает тому из пары (человеку или ИИ), кто изначально демонстрировал лучшие результаты. Получается, в ряде случаев лучше доверить задачу исключительно машине (если она объективно превосходит человека), а в ряде случаев — человеку (когда он ориентируется в задаче лучше, чем алгоритм).

Творческие задачи против задач на принятие решений

Один из ключевых факторов, определяющих успех союза «человек+ИИ», связан с типом задачи. Исследователи разделили все эксперименты на:

1) Decision tasks (задачи на принятие решения): выбор из ограниченного набора вариантов, например «да/нет», «к какому классу принадлежит объект?» и т. п.

2) Creation tasks (задачи на создание или генерацию контента): написание текстов, создание изображений, креативных концепций, то есть такие задачи, где нет единственно «верного» решения, а результат может быть оценён по качеству или оригинальности.

Оказалось, что для задач выбора (decision tasks) сочетание «человек+ИИ» почти всегда проигрывало лучшему из них по отдельности (средний показатель g = -0.27, p = 0.002). Когда в рамках одной и той же задачи алгоритм работает точнее человека, попытка дополнить его человеческим мнением зачастую лишь вносит ошибки: люди либо слишком доверяют машине там, где надо перепроверить, либо напротив игнорируют правильный «совет» алгоритма. Если же человек превосходит алгоритм, то добавление компьютерных подсказок тоже может не улучшить положение, ведь итоговая эффективность зависит от того, насколько грамотно человек фильтрует автоматические выводы.

В отличие от этого, в задачах творчества (creation tasks) среднее значение Hedges’ g для синергии получилось положительным (около 0.19), хотя из-за относительно небольшой выборки (34 эффекта) эта величина не достигла строгой статистической значимости. Тем не менее разница между задачами на принятие решения и творческими кейсами оказалась существенной и подтверждает идею, что человек может привносить креативность, а ИИ — быстрые наработки и рутину, в результате чего союз становится плодотворнее одиночной работы. Особенно ярко это проявляется там, где нужно не просто выбрать из заранее известного набора ответов, а придумать что-то новое.

Рис. 1: Лесовидные диаграммы (forest plots) всех размеров эффекта (k = 370), включённых в мета-анализ. a,b. Положение точек на оси X показывает величины размера эффекта, а горизонтальные отрезки (полосы) обозначают 95%-ные доверительные интервалы для этих величин. Цвет точек и полос соответствует значению эффекта: отрицательные эффекты выделены красным, положительные — зелёным. Чёрная пунктирная линия соответствует эффекту g = 0, указывая, что система «человек + ИИ» показывает такую же результативность, как и базовое условие. Точка в нижней части каждого графика обозначает итоговое мета-аналитическое среднее значение эффекта и его доверительный интервал.
Рис. 1: Лесовидные диаграммы (forest plots) всех размеров эффекта (k = 370), включённых в мета-анализ. a,b. Положение точек на оси X показывает величины размера эффекта, а горизонтальные отрезки (полосы) обозначают 95%-ные доверительные интервалы для этих величин. Цвет точек и полос соответствует значению эффекта: отрицательные эффекты выделены красным, положительные — зелёным. Чёрная пунктирная линия соответствует эффекту g = 0, указывая, что система «человек + ИИ» показывает такую же результативность, как и базовое условие. Точка в нижней части каждого графика обозначает итоговое мета-аналитическое среднее значение эффекта и его доверительный интервал.

Когда машина сильнее человека и наоборот

Второй важнейший фактор — чья «одиночная» работа в задаче даёт лучший результат. Авторы проанализировали две подгруппы: (1) ситуации, где ИИ превосходил человека, (2) случаи, где человек был сильнее алгоритма. Если алгоритм лучше, чем человек, то добавление человека ощутимо ухудшает результат (g = -0.54). Если же сильнее оказывается человек, то появление ИИ даёт выраженный позитивный вклад (g = 0.46). Практический смысл прост: если машина уже способна классифицировать изображения с высокой точностью (например, определять конкретный вид птицы по фотографии или выявлять болезнь на рентгеновском снимке — в статье «дифференциальная диагностика» означает, что компьютер помогает отличить одну патологию от другой), то люди нередко «перебивают» правильные ответы лишними сомнениями. Однако если человек изначально лучше замечает нюансы и контекст, чем алгоритм, то ИИ может взять на себя часть рутинной работы, а человек — принимать ключевые решения, что действительно даёт суммарно более высокий результат.

Заключение: практическая ценность и перспективы

Важно подчеркнуть, что отсутствие «средней» синергии (когда «человек+ИИ» превосходит и человека, и алгоритм по отдельности) не означает, что союз человека и машины бесполезен. На самом деле мета-анализ подтверждает «усиление человека»: в сравнении «только человек» и «человек+ИИ» чаще побеждает пара «человек+ИИ». Однако если сравнивать «человек+ИИ» с «лучшим одиночным исполнителем» (человеком или алгоритмом), итог зависит от того, кто изначально был сильнее. Если ИИ уже превосходит человека, добавление человека обычно снижает точность. Если же человек изначально показывает более высокие результаты, участие ИИ даёт ощутимый прирост, и «человек+ИИ» оказывается эффективнее, чем человек в одиночку.

В итоге авторы дают несколько рекомендаций. Во-первых, стоит тщательнее проектировать процесс взаимодействия, стремясь разделять задачу на подзадачи и делегировать каждую подзадачу тому, кто в ней компетентнее — человеку или алгоритму. Во-вторых, творческие задания открывают перспективы для истинной «сильной синергии»: при создании текстов, изображений и других оригинальных продуктов сочетание человеческого вдохновения и вычислительной мощи может оказаться особенно выгодным. В-третьих, важно смотреть не только на долю верных решений, но и на контекст ошибок, их возможные последствия и экономические затраты.

Таким образом, если рассматривать задачу строго в терминах «кто лучше справляется с решением» и измерять успех по точности и скорости, вычислительный алгоритм может превзойти человека там, где контекст уже хорошо формализован и автоматизация достаточно отлажена. Но человек, умея замечать сложные детали или неожиданно комбинировать идеи, чаще достигает лучшего результата там, где нужно нестандартное мышление. Это подтверждается тем, что «гибрид» показывает высокую эффективность, когда изначально сильнее оказывается человек, а также когда задача требует креатива. В сфере практических применений — от медицинской диагностики до создания контента — результаты исследования наглядно показывают: если задача требует в первую очередь точности в рутинных операциях, эффективнее довериться алгоритмам. Но когда важна креативность и учёт тонких, неочевидных нюансов, человек остаётся незаменимым, а ИИ может стать хорошим дополнительным инструментом.

Статья в открытом доступе