Учёные из ETH Zurich создали алгоритм машинного обучения, способный с идеальной точностью распознавать изображения в Google reCAPTCHA v2. Несмотря на критику и устаревание этих тестов, они всё же остаются важными для обеспечения безопасности в интернете.
Капча давно стала объектом гонки вооружений между системами защиты и ботами, предназначенными для её обхода. Последние исследования показали, что боты могут решать практически все варианты капчи быстрее и точнее людей, что фактически подрывает её защитные функции, которые предназначены для разделения людей и автоматизированных программ.
Метод, представленный учеными из Цюриха, опирается на предыдущие модели машинного обучения и значительно улучшает их эффективность. Ранее опробованные открытые решения и другие исследования дали неоднозначные результаты с использованием моделей You Only Look Once (YOLO), однако последние испытания продемонстрировали 100-процентную точность. Изначально такие модели успешно распознавали изображения объектов, например, светофоров или автомобилей, но испытывали сложности в распознавании других признаков, указывающих на человеческую активность.
Многие системы Captcha стремятся анализировать движения курсора, имитирующие человеческие, и проверять файлы cookie для различия между людьми и ботами. Например, Cloudflare использует простую страницу, способную выявлять такие признаки с минимальным вмешательством человека. Защитные меры Google аналогичны, однако, в определенных случаях могут включать тесты на распознавание изображений reCAPTCHA v2, что создает возможность для обхода ботами.
Для достижения высокой точности работы модели YOLO была переработана версия YOLOv8 с использованием дополнительного программного обеспечения, которое помогает эмулировать движения мыши и подделывать историю браузера. Также исследователи применили VPN-сервисы, обеспечивающие динамическое изменение IP-адресов, чтобы снизить вероятность обнаружения множества попыток входа с одного и того же адреса.
Данная работа демонстрирует, что развитие машинного обучения и генеративного ИИ может серьезно подорвать эффективность технологии Captcha, так как с помощью доступного ПО можно успешно проходить эти тесты. Более того, YOLOv8 функционирует даже на относительно слабом оборудовании, что увеличивает шансы на масштабные автоматизированные атаки с привлечением множества недорогих устройств. Технологические компании продолжают искать новые способы защиты интернет-трафика от бот-атак.