Искусственный интеллект Perplexity грабит интернет

14 прочтений

28 июня

В каждом цикле ажиотажа вокруг новых технологий возникают определенные схемы обмана. В последний крипто-бум это были «понциномика» (когда проценты старым вкладчикам выплачивались за счет новых) и «перетягивание каната». В беспилотных автомобилях до этого было «всего пять лет!». Теперь, в сфере ИИ, мы видим, сколько фигни можно натворить и остаться безнаказанным.

Компания Perplexity, в которую вливают сотни миллионов долларов инвестиций, пытается создать конкурента Google в сфере поиска. Однако их цель — не просто «поисковая система», а «механизм ответов». Идея в том, чтобы вместо перебора кучи результатов для поиска ответа, пользователь сразу получал готовый ответ, найденный Perplexity.

«Достоверность и точность — это то, о чем мы заботимся», — заявил генеральный директор Perplexity Аравинд Шринивас в интервью The Verge.

Выдёргивание фактов из авторитетных источников 🕵️‍♂️

По сути, Perplexity выдёргивает ответы на заданные ей вопросы из источников информации, которые считает авторитетными. Изначально ценность поисковиков была в том, что они направляли трафик на сайты-источники, сокращая работу журналистов и других авторов контента. Но, предоставляя готовый ответ вместо ссылки на первоисточник, такие «механизмы ответов» лишают источники рекламного дохода, забирая его себе.

Perplexity пошла еще дальше со своим продуктом Pages, который создает целый сводный «отчет» на основе первоисточников. Это уже не просто цитирование пары предложений для прямого ответа на вопрос, а создание полноценной статьи-агрегации. И, может, этого достаточно в плане точности приведённых фактов, но по сути это активный плагиат используемых источников.

Нарушение авторских прав и преодоление paywall 🚨

Forbes обнаружил, что Perplexity обходила платный доступ издания, чтобы представить краткое изложение их расследования в отношении компании по производству дронов бывшего гендиректора Google Эрика Шмидта. Perplexity не только каким-то образом обошла paywall (скрытая часть статьи, представляемая по подписочной системе), но и практически процитировала оригинальное расследование, использовав графику Forbes для своего отчета. Это явное нарушение авторских прав.

Агрегирование контента не ново, но масштабы, в которых это делает Perplexity, наряду с нарушением копирайта оригинальных иллюстраций, довольно примечательны. Коммерческий директор компании попытался всех успокоить, рассказав Semafor, что они разрабатывают планы распределения доходов с изданиями. Но как получилось, что все так разозлились на продукт, который еще в разработке?

Игнорирование robots.txt 🤖🚫

Wired подтвердил, что случай с Forbes не был исключением. Perplexity игнорирует robots.txt — код, явно запрещающий веб-сканерам индексировать страницу. Шринивас ответил в Fast Company, что на самом деле это делают сторонние скрейперы, которые Perplexity использует. Но он отказался назвать эти скрейперы и обязать их соблюдать robots.txt.

Детский аргумент «это сделал кто-то другой», не находите? Будь Шринивас действительно этичен в своих намерениях, у него было два варианта: расторгнуть контракт со скрейпером-нарушителем или убедить его соблюдать robots.txt. Он не сделал ни того, ни другого. Очевидно, «механизм ответов» Perplexity зависит от того, чтобы кто-то нарушал правила за них.

Ложь и обман ради данных 🤥

Многие ИИ-гиганты прибегают к сомнительно законным и неэтичным действиям ради нужных данных. Чтобы доказать ценность Perplexity инвесторам, Шринивас создал инструмент для взлома Twitter API, притворившись академическим исследователем.

«Я бы назвал свои [поддельные академические] проекты такими же, как Brin Rank и все подобные вещи», — хвастался он в подкасте. Видимо, ложь кажется ему забавной и умной.

Это проясняет реальное ценностное предложение «механизмов ответов». Perplexity не может сама генерировать актуальную информацию и полагается на источники, политику которых нарушает. Такой подход был разработан людьми, которые не стесняются лгать, когда им удобно. И это необходимо для работы Perplexity.

Разрушение основ доверия в Сети 💔

Настоящая «инновация» Perplexity — в разрушении принципов доверия, на которых построен Интернет. Вопрос в том, волнует ли это кого-то из пользователей или инвесторов сервиса.

Лично я крайне скептически отношусь к таким практикам и считаю, что они подрывают саму суть свободного обмена информацией, на котором зиждется Всемирная паутина. Будущее покажет, какую цену мы заплатим за погоню за быстрыми ответами любой ценой.

Подписывайтесь на наш телеграм-канал и читайте прошлую статью, если пропустили:

Windows на ARM: долгий путь к совершенству

Обайти27 июня

ОбайтиАвторское мнение о высоких и не очень технологиях.

1,2K подписчиков