Учитывать взаимодействие человека и машины начали давно. Многие изобретатели и учёные подходили к этому вопросу с юмором. Юмор выражается по-разному и может приносить материальную пользу создателю машинизированных систем.
Знаменитый изобретатель Томас Алва Эдисон (1847-1931 гг.) удивлял своих знакомых, приходящих к нему в гости тем, что входная калитка его дома тяжело открывается.
- Неужели такой умный человек не может починить собственную калитку?! - спрашивали многие посетители.
- С калиткой всё в порядке, - отвечал иногда изобретатель. - Просто она соединена с насосом домашнего водопровода и вы, каждый раз открывая её, накачиваете в цистерну несколько литров воды.
То́мас А́лва Э́дисон - американский изобретатель и предприниматель, получивший в США 1093 патента и около 3 тысяч в других странах мира; создатель фонографа; усовершенствовал телеграф, телефон, киноаппаратуру, разработал один из первых коммерчески успешных вариантов электрической лампы накаливания. Именно он предложил использовать в начале телефонного разговора слово "алло".
Википедия
Приёмы, подобные "калитке Эдисона", используются для наполнения информационных систем новыми сведениями. При использовании поисковых систем пользователь сообщает системе то, что ему интересно и тем самым корректирует интересы самой системы.
При регистрации в новой социальной сети в регистрационной форме, кроме своих интересов, пользователю может быть предложено рассказать смешной анекдот, а затем окажется, что в этой соцсети самый полный сборник лучших народных анекдотов.
При заполнении тестов (в том числе и графических), опросов, капчей (captсha - система подтверждения действий пользователя) и выставлении лайков происходит обучение интеллектуальных систем.
Обучение интеллектуальных систем с помощью Captcha
Многие пользователи при скачивании файлов, заполнении анкет, форм обращения проходят этап подтверждения своих действий через графический тест Captcha. В таком тесте обычно предлагается указать курсором мыши участок фотографии, на котором изображён конкретный образ (автомобиль, человек, элемент местности и др.).
Таким способом система может предлагать пользователям "разметить фотографию", чтобы потом обработать их разметку и самообучиться распознаванию новых образов. Человек обучает информационную систему и параллельно подтверждает, что пользователь является живым человеком, а не программным роботом для скачивания контента.
В подобной человеческой разметке представленных фотографий заключена первичная система распознавания образов. Искусственный интеллект базируется на системе человеческого восприятия и делает на этой основе собственные выводы.
Псевдоумная поисковая система без собственного распознавания графики может быть написана всего несколькими десятками строк программного кода. Такая система будет хранить все результаты человеческой обработки изображений и сможет выдавать их по запросам ключевых слов, которые предварительно разметили на изображении люди (пользователи). Такими были первые поисковики картинок в Интернете, основанные на принципе "калитки Эдисона" - информацию (чистую воду в цистерну) накачивали пользователи.
Современные системы также потребляют результаты "необременительного труда" пользователей, но обладают большей самостоятельностью в оценке содержимого и могут синтезировать новые данные (изображения, созданные роботами-художниками).
Результаты системы Captcha можно использовать для различных психологических исследований, которые производятся на законной основе. Если собрать обезличенные данные системы подтверждения пользователя, на которой пользователь должен вписать в поле число, изображённое на картинке и замаскированное различными штрихами линиями (графическими помехами), то можно не только обучить распознаванию электронную систему но в целом определить границы эффективности человеческого зрения.
При многочисленном использовании такой системы подтверждения могут накапливаться картинки, на которых человек не смог распознать числа - это и будут графические элементы, содержащие труднораспознаваемые человеком образы.
Если у исследователей существует массив изображений, которые обучаемая система не распознаёт, то его можно проверить среди пользователей и выделить часть графической информации, которую человек обрабатывает, а искусственный интеллект пока нет. Так можно разработать систему камуфлированного написания, недоступного распознаванию через системы компьютерного зрения.
Разработчики, с целью дообучения своих интеллектуальных систем, именно так и поступают: проверяют нераспознанное машиной через человеческое зрение и возвращают положительные результаты в систему для создания новых алгоритмов.
Подобные необременительные взаимодействия между пользователем и электронной информационной системой называются обучением типа "Человек-Компьютер" и направлены на развитие биологической и технической сферы.
Дополнительные материалы по теме этой статьи:
- Способы обмана нейросетей распознавания образов: прошлое или актуальность?
24 октября 2019 года.
автор: юрист Демешин Сергей Владимирович.
Участвуйте в обсуждении, пройдите опрос об интересных темах будущих публикаций (ссылка опроса в описании канала, также в описании указаны правила комментирования публикаций).