Найти в Дзене
Техникум

Почему робот не может пройти капчу

Разбираемся, что это такое капча, как работает, и можно ли её взломать

Представим типичную ситуацию: вы пытаетесь залогиниться на сайте или покупаете билеты онлайн, и тут компьютер просит доказать, что вы не робот. Для этого чаще всего нужно ввести какие-то буквы и цифры. Откуда взялась эта система и как она работает? В этом материале мы разберёмся, что такое капча.

-2

Капча (от CAPTCHA) – это аббревиатура, которая переводится с английского как «полностью автоматизированный тест Тьюринга, отличающий людей от компьютера». Система появилась в 1997 году в виде привычных для нас картинок с искажёнными буквами. Она создана для того, чтобы предотвращать автоматическую регистрацию или отправку сообщений ботами – то есть борется со спамом.

Алан Тьюринг. Источник: Godrey Argent Studio, via The Royal Society
Алан Тьюринг. Источник: Godrey Argent Studio, via The Royal Society

Теперь посмотрим, как работает этот алгоритм. В основу капчи, как следует из названия, лёг тест Тьюринга. Изначально это был эксперимент, во время которого условный судья должен определить по ответам на вопросы, человек с ним говорит, или машина.

В случае с капчей даются такие задачи, которые просты для человека и сложны для машины. В большинстве случаев капча представляет собой искажённый текст. Компьютерам не хватает той изощрённости в обработке визуальных данных, которой обладают люди. На изображении каптчи буквы и цифры могут растягиваться, изгибаться, перекрещиваться между собой или с посторонними объектами, и все эти ухищрения мешают ботам.

-4

Пожалуй, второй по популярности вид капчи – это распознавание предметов. Наверняка вам знакомы эти страдания – мотоцикл там на горизонте или что? А считается ли столб от светофора светофором?..

Есть и более интересные формы капчи – например, математические примеры, загадки, задания на простую логику.

-5

Для тех, у кого проблемы со зрением, есть звуковые капчи. В них произносятся буквы и цифры с посторонними шумами. Обычно этого достаточно, чтобы помешать программам распознавания голоса.

Для создания капчи нужен довольно обширный банк изображений с соответствующими ответами. Программа случайным образом генерирует тест для пользователя и сверяет, совпал ли его ответ с установленным.

Кстати, некоторые виды капчи не только служат для отсеивания ботов, но и помогают оцифровывать книги. Вот как это работает. Администратор программы сканирует книгу, затем программа выбирает из картинки два слова, одно из которых ей известно. Если посетитель вводит это слово безошибочно, приложение предполагает, что второе введённое слово тоже правильно. Это второе слово входит в список тех, которые приложение будет представлять другим пользователям. В конце концов, программа получает достаточно ответов. Таким образом, капча может одновременно проверять содержание оцифрованной книги и убеждаться, что доступ к услугам получают живые люди.

-6

Где капчи нужнее всего? Во-первых, в онлайн-опросах и голосованиях, для того чтобы избежать многочисленных вбросов. Во-вторых, в регистрационных формах на сайтах, среди которых бесплатные сервисы электронной почты. Иначе почта может наполниться тысячами учётных записей, рассылающих спам. В-третьих, капча нужна на сервисах продажи билетов, чтобы спекулянты не скупали всё за считанные секунды с помощью ботов. И наконец, система используется на виртуальных досках объявлений.

-7

А можно ли взломать капчу? Да, но для этого нужно разрабатывать определенные алгоритмы. Возьмём тест, который предлагает буквы. Сначала бот должен обесцветить изображение, чтобы его не сбивали разные оттенки. Затем программа будет сравнивать каждый искажённый символ с заданным шаблоном и искать сходства. И возможно найдет, но без гарантии. Поэтому в целом, теоретически можно обмануть любую капчу. Правда, разработчики капчи тоже не стоят на месте и совершенствуют варианты проверки.

Пишите в комментариях, в первого ли раза проходите капчу?