1947 подписчиков

У Википедии проблемы с «AI»-переводом

5 марта5 мар

2 мин

Большие языковые модели, называемые «ИИ», допускают ошибки. Википедия столкнулась с «галлюцинациями» в статьях, переведенных с помощью БЯМ, созданных сторонней организацией OKA. Проблема в том, что переводы делаются без должной проверки человеком. — pcworld.com Большие языковые модели, которые в маркетинговых целях называют «ИИ», иногда выдумывают вещи. Это проблема, с которой сталкивается каждый, кто пользуется ими хотя бы недолго — и ошибаются они не только в базовой информации. Википедия борется с одним из таких примеров, обнаруживая «галлюцинации» в статьях, переведенных с помощью БЯМ. Начало этой истории позитивное и альтруистичное: сторонняя некоммерческая организация Open Knowledge Association (OKA) выплачивает стипендии людям, переводящим статьи Википедии на другие языки. Проблемы возникают из-за того, что для перевода используются большие языковые модели, такие как Google Gemini и ChatGPT, без проверки человеком. Согласно отчету 404 Media, редакторы Википедии, проводящие рутин

Большие языковые модели, которые в маркетинговых целях называют «ИИ», иногда выдумывают вещи. Это проблема, с которой сталкивается каждый, кто пользуется ими хотя бы недолго — и ошибаются они не только в базовой информации. Википедия борется с одним из таких примеров, обнаруживая «галлюцинации» в статьях, переведенных с помощью БЯМ.

Начало этой истории позитивное и альтруистичное: сторонняя некоммерческая организация Open Knowledge Association (OKA) выплачивает стипендии людям, переводящим статьи Википедии на другие языки. Проблемы возникают из-за того, что для перевода используются большие языковые модели, такие как Google Gemini и ChatGPT, без проверки человеком.

Согласно отчету 404 Media, редакторы Википедии, проводящие рутинную проверку переведенных статей, обнаружили базовые фактические ошибки, которых не было в статьях на языке оригинала, а также отсутствующие или перепутанные ссылки, либо ссылки на страницы книг, не имеющие отношения к теме. (БЯМ особенно плохо справляются с документацией, как многие юристы обнаружили к своему сожалению.) Ранее в этой системе использовался Grok — БЯМ Илона Маска, интегрированная с eX-Twitter и известная производством массового количества неконсенсуального сексуального контента, — но, по сообщениям, OKA изменила свою политику.

Авторы Википедии почти полностью работают на добровольных началах. Человек может редактировать Википедию в рамках своей основной работы, например, будучи PR-агентом, но такие правки требуют раскрытия информации и подлежат дополнительной проверке. Добавление коммерческого элемента в масштабные правки, даже ради перевода, может стимулировать работников, оплачиваемых Open Knowledge Association, работать быстро и допускать ошибки. OKA платит своим работникам около 400 долларов в месяц за работу на полную ставку по переводу. Это немного, но этих денег гораздо больше хватает в странах Глобального Юга, где проживает большинство переводчиков.

Несмотря на общую политику Википедии против статей, сгенерированных БЯМ, редакторы Википедии решили продолжить пользоваться услугами OKA. Поскольку английская Википедия по-прежнему вдвое больше следующей по размеру языковой версии (если не считать себуанскую Википедию, которая, по-видимому, почти полностью сгенерирована ботами), а языки с меньшим числом носителей часто обслуживаются плохо, переводы важных статей крайне необходимы. Однако переводчики OKA сталкиваются с гораздо более строгими редакционными правилами, чем обычные пользователи: после пяти задокументированных ошибок переводчик OKA может быть заблокирован, а его предыдущие переводы могут быть удалены, если более старший редактор не возьмет на себя ответственность.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Michael Crider

Оригинал статьи

Гаджеты и электроника

5,73 млн интересуются