Сервис reCAPTCHA нужен не только для того, чтобы доказывать, что вы не робот. С этой задачей он, конечно, справляется, а еще его с 2005-го года стали использовать для оцифровки книг и документов. Ведь сейчас в мире существует огромный печатный архив, который хочется перевести в цифровой вид. Сканер с распознавателем справлялись, но не до конца: часть информации система просто не могла узнать из-за расплывшихся надписей или других дефектов. Человек же справлялся с такой задачей на раз-два.
И тогда reCAPTCHA стал показывать пользователям, которые должны были пройти проверку на робота, пары слов. Первое проверяющий компьютер уже знал, а второе брали из сканов старых номеров издания The New York Times.
Люди так часто проходили капчу, что годовой объем статей этой газеты расшифровывали каждые четыре дня.
Чуть позже, в 2009-м, Google приобрела сервис reCAPTCHA и с ее помощью запустила «Гугл-книги» – проект по оцифровке всех существующих книг. К 2019-му компании было переведено в электронный формат более 40 миллионов книг.
В 2014-м году появилась новая версия сервиса, дополнительной задачей которой стала уже не оцифровка книг, а улучшение работы «Гугл-карт». Так что не просто так мы отмечаем велосипеды, светофоры, автобусы и пожарные гидранты.
А машины продолжают совершенствоваться, потому что человек, проходящий проверку на робота, делал не только это, но еще и обучал систему, как правильно расшифровать слово или различить объект.
Исследование Google 2014-го года показало, что человек мог расшифровать самую сложную буквенную капчу с точностью в 33%. Нейросеть же даже с технологиями того времени справлялась с точностью до 99,8%.