Все пользователи интернета хотя бы раз сталкивались с капчей — проверкой на автоматизированные действия. Когда очередной сайт требует от пользователя пройти капчу, он хочет убедиться, что компьютером управляет человек, а не автоматизированная программа — бот.
Всё началось со спама
На раннем этапе развития интернета серьёзной проблемой был спам — массовая рассылка рекламы через электронную почту. Тогда ещё не существовало инструментов, позволяющих ограничить это явление, и спамеры беспрепятственно создавали тысячи почтовых аккаунтов, с которых занимались спам-рассылкой. Существенная часть писем, отправляемых спамерами, являлась обыкновенным мошенничеством.
Спам не стал бы массовым явлением, если бы спамеры не начали использовать ботов, благодаря которым все действия были автоматизированы — от регистрации аккаунтов в почтовых сервисах до непосредственной рассылки тысяч писем.
«Нигерийские письма»
Самым популярным мошенническим спамом стали письма, в которых мошенники представлялись нигерийскими королями, чиновниками или банковскими работниками и предлагали получателю письма принять большую сумму на тех или иных условиях. Мошенники были настолько хорошо организованы, что имели реальные офисы, сайты, настоящие печати и бланки, а также связи с действующими банковскими и государственными служащими Нигерии.
Легенды и персонажи этих писем весьма разнообразны. Согласно одному из многочисленных сюжетов, некий нигерийский принц якобы хочет оставить большое наследство получателю такого письма, так как он якобы является дальним родственником. Но сперва необходимо заплатить за получение денежного перевода, оформление документов, оплату различных услуг и так далее. Это явление имело столь массовый характер, что получило название «Нигерийские письма» и стало частью интернет-культуры.
Капча против ботов
Потоки спама нагружали почтовые серверы и наполняли электронную почту обычных пользователей бесполезными письмами, и с этим нужно было что-то делать. В качестве решения этой проблемы в конце 90-х был придуман специальный тест, который позволил остановить ботов. Этот тест и был первой версией капчи и представлял из себя достаточно искажённые слова и буквы, чтобы их мог прочитать человек, но не могла распознать компьютерная программа. Правильный ввод искажённого текста означал, что сайтом пользуется реальный человек.
Создатели ботов были вынуждены совершенствовать свои программы по автоматизации действий и искать всевозможные способы обхода капч. Капчи в ответ становились более совершенными. В какой-то момент в интернете появились услуги по разгадыванию капч реальными людьми за небольшие деньги, что позволило ботам действовать в обход систем проверки. Дешёвая рабочая сила из бедных стран всё испортила, а противостояние ботов и капч продолжилось.
Как капча заставила людей работать бесплатно
В 2007 году была выпущена новая версия капчи — reCAPTCHA, а в 2009 году эту разработку купила компания Google. Помимо усовершенствованной проверки на ботов, reCAPTCHA привнесла одну полезную функцию — оцифровка старой литературы.
В новой капче пользователь должен ввести уже два слова: одно известно системе заранее и является проверочным, а второе слово — это отсканированный фрагмент из книги или газеты, который системе неизвестен. Если пользователь правильно вводит первое слово, то капча считает, что и второе слово тоже введено верно. Когда большинство вводит одно и то же, система принимает такой ответ за истинный.
С одной стороны, такой метод позволил оцифровать огромное количество печатной продукции. С другой, для этого использовался бесплатный человеческий труд — пользователи не получали вознаграждение за свою работу.
Я — не робот
Со временем капча становилась сложнее для ботов и проще для людей. В 2014 году reCAPTCHA обновилась и стала учитывать поведение пользователя на странице с капчей, чтобы отделить нормальные человеческие действия от автоматизированных действий ботов. То есть проверка на ботов стала запускаться в фоне, как только пользователь заходил на сайт.
В некоторых случаях система проверки всё же требует от пользователя дополнительного подтверждения, что компьютером управляет человек, и тогда приходится пройти капчу, но в большинстве случаев для этого достаточно просто нажать на пустой квадрат рядом с надписью «Я — не робот».
Если капче и этого недостаточно, то пользователю предлагается выбрать определённые картинки. Например, пользователь должен выбрать все картинки, на которых изображены лестницы, светофоры, велосипеды и так далее. При этом капча считает проверку пройденной, даже если пользователь допустил ошибку, так как в основном учитывается именно взаимодействие с капчей: если действия пользователя не похожи на автоматизированные, то этого в большинстве случаев достаточно.
Google знает, где вы были
Современная reCAPTCHA используется на огромном количестве сайтов, и это позволяет учитывать активность конкретного пользователя на всех сайтах с этой системой проверки, которые пользователь посещал ранее. Для его идентификации используются ip-адрес, браузер, операционная система, используемый язык, установленные дата и время, а также прочие идентификаторы, такие как Cookie и даже разрешение экрана.
Это похоже на систему глобального наблюдения за пользователями интернета по всему миру. По сути, так оно и есть. Такова плата за то, чтобы интернет не был заполонён ботами, мешающими людям пользоваться сайтами и различными онлайн-сервисами. В противном случае, мы бы до сих пор получали безумное количество спама на электронную почту, а заодно и в социальных сетях и мессенджерах. Существуют альтернативные капчи, но так сложилось, что именно капча от Google стала самой массовой.
Нейросети против капчи
Со временем нейросети развились настолько, что научились обходить капчи. Теперь они могут не только имитировать человеческое поведение на сайте и распознавать очень сильно искажённый текст, но и распознавать даже объекты на изображениях. Искажать текст ещё сильнее или придумывать ещё более сложные задачи — это тупиковый путь, так как в какой-то момент людям станет слишком сложно проходить такие капчи. Поэтому постоянно создаются новые методы выявления ботов, продолжая эту технологическую гонку.