Найти тему
Data and Intelligence

Распознование образов #1 Введение.

Всем привет. С вами блог «Data and Intelligence» - Блог обо всем, что связанно с Искусственным интеллектом и обработкой данных. Нейронные сети, алгоритмы, обработка и представление данных… Все это в этом блоге. Добро пожаловать.

Сегодня мы начнем погружаться в очень широкую тему: распознавание образов. Что это такое? Это тема, находящаяся на стыке разных научных дисциплин, и включающая в себя все, что связанно с классификацией и идентификацией чего-либо. Предметы, явления, процессы, сигналы, изображения, звуки… все, что можно представить в виде набора свойств и признаков.

Основным набором методов распознавания образов являются методы статистического или машинного обучения. Типичная задача такого обучения выглядит следующим образом. Есть некоторое количество объектов с набором свойств. Часть из этих свойств являются наблюдаемыми, а часть – ненаблюдаемая, но известная. Требуется построить алгоритм, определяющий ненаблюдаемые свойства по наблюдаемым.

Знакомая задача? Да, эту же задачу решают и нейронные сети. Собственно, это один из способов реализации решателя для нашей задачи. Расширим набор объектов в ту область, где ненаблюдаемые свойства нам не известны, и мы получим задачу прогнозирования. Расширим набор объектов в ту область, где наблюдаемые свойства лежат между имеющимися объектами, и мы получим задачу аппроксимации.

Алгоритм, который мы хотим получить, не обязательно должен работать с абсолютной точностью, а должен хотя бы ошибаться не слишком сильно и не слишком часто. Меру «слишком» определяем мы сами, исходя их наших задач. Причем, нам нужен в первую очередь не сам алгоритм получения ненаблюдаемых свойств, а алгоритм более высокого уровня, мета-алгоритм, позволяющий получить уже непосредственно алгоритм получения свойств…

Не слишком запутанно? Теперь все обозначим. Саму задачу мы назовем задачей распознавания образов, алгоритм распознавания образов – распознавателем, а мета-алгоритм – обучением распознавателя.

Также теория статистического обучения решают и другие задачи, например задачу кластеризации: разбиение набора объектов по их свойствам на группы. Такие группы называются кластерами, алгоритм должен определять, к какому кластеру принадлежит объект. Эта задача также расширяется и на и объекты, предъявляемые впоследствии. Кластеризация часто возникает как вспомогательная задача в распознавании данных.

Примеров задач распознавания образом большое множество. Во-первых, это может быть просто узнавание образов. Картинки, на которых нарисован или отсутствует какой-либо предмет. Задача для алгоритма – распознать, есть предмет на картинке или нет.

Задача распознания букв более сложная. Это могут быть как рукописные буквы, так и машинописные буквы из разных шрифтов, что могут радикально отличаться друг от друга. Задача здесь научиться узнавать, какая именно буква здесь нарисована. Это расширение предыдущего примера. Впрочем, и текущий пример можно расширить еще сильнее.

Распознавание текста. Или, формализуя задачу, распознание массива букв. Усложняет задачу здесь связь между буквами в рукописном тексте или слияние букв в машинописном, наличие или отсутствие пробела, что тоже нужно узнать. На выходе мы должны получить готовый текст, прочитанный алгоритмом с листа.

Распознавание голосовых команд – Еще более сложная задача для алгоритма. В общем виде – распознание коротких команд в общем потоке звука, произнесенных произвольным голосом.

Усложним этот пример, пусть теперь алгоритм распознает речь и записывает ее в виде текста. Также, фоновый шум, также произвольный голос, произвольной интонацией с любой громкостью…

Следующая задача носит более статистический и менее формализованный характер. Требуется провести медицинскую диагностику – имеется история болезни с приложенными результатами обследований. Требуется поставить диагноз и назначить лечение. В общем виде это огромное количество симптомов и результатов различных исследований, не все из которых имеют отношение к диагнозу.

Более обширной задачей может стать только экономическое прогнозирование. Здесь все зависит от масштабов, детальности входных данных, а также требуемых результатов. Например, спрогнозировать спрос на определенный товар в ближайшее время по результатам продаж различных видов товаров в различных магазинах.

Ну а в следующий раз мы повнимательнее рассмотрим постановку задачи распознавания образов. Входы и выходы алгоритма, а также задачи классификации и регрессии. Если вам интересна эта тема – ставьте лайк и подписывайтесь на канал, это блог «Data and Intelligence» - всем пока.