Всем знакома ситуация заколдованного круга, в котором решение одной проблемы напрямую зависит от другой, а другая может быть решена только после того, как разделаются с первой.
Короче, как в той пошлой шутке родом из моей студенческой юности: девушку не любят, потому что у неё прыщи, а прыщи у неё потому, что её не любят.
Оказывается, такие зацикленности есть и в IT сфере. В частности, когда речь идёт об автоматизированном распознавании рукописного текста, обычно вспоминают про так называемый ПАРАДОКС СЭЙРА, который звучит так: написанное скорописью слово не может быть распознано без сегментации и не может быть сегментировано без распознавания.
Сложность распознавания текста сама по себе связана не столько с тем, что необходимо идентифицировать прописную букву и превратить её в печатную. Главная проблема - именно в том, что буквы человек обычно пишет безотрывно и они сливаются друг с другом, а сам он их распознаёт, скорее, интуитивно.
В принципе, спроектировать автоматизированные системы, способные распознавать слова, написанные в печатном формате, довольно несложно, старый добрый FineReader научился делать это на раз. Но вот с рукописным всё ой как непросто. Причём не только в нашей стране, с её кириллическими традициями, но и в странах, где используют латиницу.
Но у нас с этим всё-таки больше проблем, мне кажется.
ПАРАДОКС СЭЙРА работает всякий раз и в каждом случае, когда машина сталкивается со "слипшимися" буквами. И всё бы ничего, если бы программе преподнести сначала каждую букву отдельно, а уже потом - созданное из них слово, пусть и написанное слитно. Тогда машина могла бы распознать их. Но если ей сразу подсунуть написанное незнакомым почерком слово, исполненное "без отрыва пера от бумаги", вот это для неё задача непростая.
Кеннет М. Сэйр (13 августа 1928 – 6 октября 2022) - американский философ, почетный профессор Университета Нотр-Дам и один из первых лидеров в изучении искусственного интеллекта.
Родился в Скоттсблаффе, штат Небраска. После школы пошёл в армию, два года отслужил в ВМС США. Затем поступил в Гриннелл-колледж, штат Айова, где получил степень бакалавра с совместной специализацией в философии и математике. После этого был Гарвардский университет, где Сэйр получил степень доктора философии.
С 1953 по 1956 год он занимал должность помощника декана Высшей школы искусств и наук Гарварда. А потом два года проработал системным аналитиком в лаборатории Линкольна Массачусетского технологического института.
Далее был период, когда он преподавал в Нью-Йорке, с временными назначениями в Принстонском университете, Государственном университете Боулинг-Грин, Оксфордском и Кембриджском университетах.
Он был одним из пионеров исследования проблемы искусственного интеллекта с точки зрения философии. И в 1965 году он создал Философский институт искусственного интеллекта (PIAI, который своей первой задачей поставил как раз создание автоматизированной системы распознавания рукописного ввода. К 1973 году там была разработана система, более успешная, чем любая другая, доступная в настоящее время.
После войны во Вьетнаме Сэйр переключил свое внимание на этические и социальные проблемы.
Вы можете поддержать канал, перечислив любую доступную вам сумму на кошелёк ЮMoney 4100 1102 6253 35 (или на карту Райффайзенбанка 2200 3005 3005 2776). И поучаствовать в создании книги по материалам этих статей. Заранее всем спасибо!