Найти тему

Про дипфейки

Den Tulinov — крутой эксперт по моей любимой теме Brain&AI — написал в своем телеграмм-канале о моей колонке для Т-invariant: «Текст эмоциональный, крик души буквально» (ссылка).

Колонка моя хотя и написана не без некоторого подъема и называется «Страх и трепет» на «крик души» все-таки не тянет. Но это на мой взгляд. Den, может, видит глубже.

Я в колонке много чего понаписал, но еще больше не написал. Например, я там совсем мельком задел тему дипфейков. А это, на мой взгляд, хоть и не «ядерная война и пандемия» в одном флаконе, как теперь называют ИИ его же главные разработчики, но тема действительно серьезная.

Гэри Маркус — один из самых известных ИИ-скептиков заметил: «Если они его так боятся, так зачем они его разрабатывают?» Вопрос резонный, вроде никто гонит. Можно и повременить. Но нет. Вот на этот вопрос, я собственно и пытался в колонке ответить.

По поводу дипфейков мне вспомнился замечательный в своем роде эпизод, который в своей книжке рассказывает известный китайский ИИист Кай фу Ли:

«В 2017 году я впервые услышал, как Дональд Трамп говорит по-китайски. Во время первой поездки президента США в Китай его выступление с приветствием, адресованным участникам крупной технической конференции, транслировалось на большой экран. Он начал свою речь на английском, а затем резко перешел на китайский. "ИИ изменяет мир, – сказал он на безупречном китайском, но с типичным для Трампа напором. – И разработки iFlyTek – это что-то фантастическое"».

Когда я это прочитал, просто охнул. И сколько же заплатила компания iFlyTek, которая весь этот трюк слепила, американскому президенту за такую охрененную рекламу? Или он вообще был не при делах? Всяко получается очень криво. Вряд ли они действительно Трампу платили — у них столько нету. Но иначе — это же дипфейк в полный рост, в самой наглой и неприкрытой форме.

Шли годы. Не так чтоб особо долго они шли, но это ведь, как считать. И вот в мае СЕО OpenAI Сэм Альтман (разработчик ChatGPT — это говорилка такая ИИ-шная, если вы случайно засиделись в танке) пришел в американский Сенат рассказывать, почему ИИ очень-очень страшный и как его надо регулировать.

И Альтмана ждал подарочек. Сенатор Блюменталь открыл слушания записанной речью, которая звучала как речь сенатора, но на самом деле это был голосовой клон, натренированный на выступлениях Блюменталя и произносящий написанный ChatGPT текст. Блюменталь спросил: а что было бы, если бы его голосовой клон сказал что-то этически и законодательно неприемлемое? Ну типа, как Трамп, прорекламировал бы китайских конкурентов. Альтман качал головой и говорил: да, полное безобразие, надо этот ИИ отрегулировать по всей программе, ох, надо.

«Речь Блюменталя» — это, конечно, штука попроще, чем «речь Трампа» в Пекине. Там было видео, и Кай фу Ли признается, что губы в буквы попадали не всегда. Но отличие, в общем, не в этом. Чтобы сделать «речь Трампа» группа серьезных профессионалов работала несколько месяцев, а вот аудио Блюменталя можно слепить за день-два, если есть достаточное количество его записей, умелые руки и, например, доступ к GPT, который OpenAI за небольшую денешку раздает всем желающим. А все это могут себе позволить очень-очень многие.

За шесть лет цена дипфейков упала на порядки. И вот поэтому они стали представлять проблему. Начинается гонка: против Геньки-генератора выступает Манька-детектор. Он генерит дипфейки — она его ловит за руку. ИИ против ИИ. Пока много новых идей и у него и у нее. Так что до какого-то стабильного состояния еще далеко. Наверно, поэтому и тексты об этом обо всем выходят несколько эмоциональные.

Владимир ГУБАЙЛОВСКИЙ