Найти тему
СПбГУ

Научи нейросеть выявлять ошибки

Учёные #СПбГУ научили нейросеть выявлять возможные уязвимости в текстовых капчах. Они проверили насколько эффективно текстовые капчи могут защищать от воздействия вредоносных программ. Специалисты Университета создали нейросеть, которая смогла распознать такую защиту, подвергшуюся более чем 20 искажениям, и доказали, что этот метод небезопасен.

Источник: unsplash.com
Источник: unsplash.com

Капча (CAPTCHA) — это компьютерный тест, который используется для определения, человек или компьютер использует систему или пытается попасть на какой-либо сайт. Основной смысл такого метода защиты в том, чтобы предложить пользователю задачу, которую легко может решить человек и которая вызывает затруднения у компьютера. Например, напечатать символы, изображённые в искаженном виде, или отметить на фотографиях определённые объекты, часто встречающиеся в жизни человека: светофоры, велосипеды и другое. Как правило, выполнить эту задачу может только человек, поскольку искусственный интеллект плохо различает искажённые объекты.

Одна из значительных проблем при работе с моделями искусственного интеллекта — это сбор данных (датасет), достаточный для обучения объёма. Основное отличие такого варианта от аналогов в том, что он позволяет распознавать сложные текстовые тесты, в которых содержится более 20 искажений сразу (изменение размеров и интервалов между буквами, создание «шума», наложение элементов друг на друга и другие).

Источник: unsplash.com
Источник: unsplash.com

Подход учёных СПбГУ состоит из двух больших этапов. Первый — дополнение модели генерацией изображений для увеличения датасет — тот объём данных, который позволит системе в дальнейшем решать задачу. Второй шаг — обучение модели на полученном наборе данных. Разработка наших информатиков позволила даже на основании ограниченного объёма распознать 63% искажённых изображений, предлагаемых в качестве компьютерного текста. По мнению учёных, этот показать говорит о небезопасности сайтов, использующих подобный вид капчи.