Найти тему
DIA Agency

Шах и мат нейросетям: искусственный интеллект столкнулся с кризисом обучения

Для хорошего полноценного развития нейросетям необходимо поглощать огромное количество информации. И естественно, что берется вся эта информация из сети. Сейчас не будем говорить об ее качестве, ограничимся простым тезисом: если начать искусственный интеллект ограничивать в ее получении, то о скором великом будущем, где все муторные работы выполняются за его счет – можно забыть…

И все бы ничего, возможно это так и осталось бы только опасениями, а не трендом, если бы огромное количество ресурсов не начало делать именно это: прятать информацию от обучающихся нейросетей:

Согласно исследованию, проведенному в рамках проекта Data Provenance Initiative, многие ресурсы в интернете начали ограничивать использование своих данных. Это может негативно сказаться на обучении мощных систем искусственного интеллекта. В ходе анализа более чем 14 тысяч доменов, которые используются в трех основных базах данных для обучения искусственного интеллекта, была выявлена тенденция к «кризису согласия». Оказалось, что около 5% всех данных и 25% самых ценных данных уже ограничены с помощью протокола «исключения роботов» (Robots Exclusion Protocol). Этот протокол позволяет владельцам сайтов блокировать автоматическое получение данных.

Стоп, не пугаемся сложности цитаты, сейчас расшифруем. Итак, полтора десятка тысяч доменов просто перестали предоставлять инфу роботам с помощью «кризиса согласия»: то есть там нейросеть не может притвориться человеком и согласовать получения информации, а машинам ее не дают. Если еще проще, то ограниченные данные прячутся за чертовски сложной капчей. Ну помните же да вот это «подтвердите, что вы человек»?

Самое страшное в этом даже не то, что роботы остались голодными, а тот факт, что человечество вновь наступает на одни и те же грабли, идя по пути наименьшего сопротивления: домен зарабатывает на живом трафике, зачем нам нейросети, давайте их ограничим, потому как они нам не приносят денег.

-2

Но стоп, господа! Вместо того, чтобы делиться информацией, собственно, для этого предназначен интернет, вы снова встали на позицию заработка, толкая тем самым искусственный интеллект не к информационному развитию, а к развитию в области того, как бы ему взломать ваши замки. Вы понимаете, что спустя какое-то время обучения, когда алгоритм будет выработан, за ваши личные данные потом никто не даст и гроша? Ибо взломать любую базу сможет любой школьник с помощью ChatGPT…