Найти тему

Чалавечае зрок больш універсальна, чым штучнае, таму што мы бачым формы... але машыны распазнаюць толькі тэкстуры

Оглавление

Калі звычайны кот (альбо белы, чорны, паласаты, альбо плямісты) прабіраецца да нас у дом, у нас не будзе шмат праблем з яго выяўленнем і ідэнтыфікацыяй, калі ён увайшоў у наша зрокавае поле, нават калі ён быў у руху ці згортваўся за падушкай.

Аднак, калі б мы не былі дома, і мы былі ўпэўненыя, што наша сістэма бяспекі, абсталяваная, напрыклад, глыбокай нейроннай сеткай, якая выконвае алгарытмы штучнага зроку, папярэдзіла б нас пра яе эфектыўнасць у выяўленні парушальніка - за выключэннем пэўных умоў. Вельмі бетон - значна менш.

Тое, што было не зусім зразумела да гэтага часу, стала прычынай гэтай розніцы. Цяпер каманда нямецкіх даследчыкаў выявіла гэта нечаканае тлумачэнне: у той час як чалавечае зрок звяртае ўвагу на формы прадметаў, штучны зрок праз глыбокае навучанне засяроджваецца на фактурах як крытэрыі ідэнтыфікацыі.

https://i.pinimg.com/564x/89/09/a6/8909a64fe8365cf005a1c003c235b2ba.jpg
https://i.pinimg.com/564x/89/09/a6/8909a64fe8365cf005a1c003c235b2ba.jpg

Не, людзі і машыны не "бачаць" тое самае

Мы схільныя думаць, што ІІ імкнецца быць толькі сінтэтычным адлюстраваннем нашых уласных спосабаў апрацоўкі рэчаіснасці, але праўда заключаецца ў тым, што, калі нейронавая сетка выконвае алгарытм глыбокага навучання, сістэма становіцца чорным полем: мы ведаем толькі, што Сістэма прысвечана пошуку шаблонаў у дадзеных, якія потым выкарыстоўвае для вызначэння найлепшага спосабу пазнакі малюнка, якога ён ніколі не бачыў.

І той факт, што ў сістэмах штучнага зроку атрымалася ўбачыць адрозненні, якія мы не ацэнім (нават пасля таго, як ІІ папярэджвае нас, што яны ёсць) і што неацэнныя змены, унесеныя ў вобраз, могуць заблытаць ІІ, нават змяняючы ідэнтычнасць таго, што ён бачыць, ужо дае нам паняцце, што людзі і машыны не "бачаць" тое ж самае, калі мы глядзім на адны і тыя ж аб'екты.

Аднак, пакуль вылічальны нейразнаўца Матыяс Бэтж і псіхафізік Фелікс Віхман не даследавалі гэты факт разам са сваёй камандай даследчыкаў з Універсітэта Цюбінген, мы не былі ўпэўнены, у чым розніца.

Даследчыкі зразумелі, што пры навучанні нейронавай сеткі з малюнкамі з пэўным тыпам "шуму" ён апынуўся пераўзыходзіць ідэнтыфікаваныя людзьмі прадметы на малюнках, падвергнутых аднатыпным скажэнням. Аднак любое невялікае яго змяненне вярнула кіраўніцтва чалавеку.

https://i.pinimg.com/564x/54/f1/38/54f138a1d721db981b958f1771d1f27a.jpg
https://i.pinimg.com/564x/54/f1/38/54f138a1d721db981b958f1771d1f27a.jpg

Больш разумны нахіл, чым здаецца

Даследчыкі зразумелі, што формы аб'ектаў застаюцца аднолькава пазнавальнымі да і пасля прымянення скажэнняў, так што тлумачэнне можа быць тым, як нейронных сетку апрацоўвае тэкстуру кожнага аб'екта.

Спосаб праверыць наяўнасць праблемы быў такім жа простым, як і геніяльным: стварыць ілжывыя выявы, якія ўтрымлівалі супярэчлівыя знакі, напрыклад, сілуэты кошак з фактурай скуры слана і мядзведзяў, зробленых з алюмініевых слоікаў. І як толькі стварылі, людзей і нейронныя сеткі спыталі, што яны бачаць. Людзі, як і належыць, убачылі ката і мядзведзя. Нейронныя сеткі нязменна рэагуюць, распазнаючы фактуры кожнага малюнка.

Чалавечую прадузятасць на карысць формы лёгка растлумачыць: мы жывем у трохмерным свеце, які дазваляе нам бачыць прадметы з розных бакоў і пры самых розных умовах, і дзе мы можам дапаўняць нашу візуальную інфармацыю іншымі сэнсамі, такімі як дотык.

Але, як бы дзіўна гэта не аддавалася перавага тэкстур, ён сапраўды мае сэнс: яны прапануюць вялікую колькасць даступнай інфармацыі ў параўнанні з некалькімі пікселямі, якія сведчаць аб форме аб'екта.

З гэтага адкрыцця каманда вырашыла стварыць сістэму распазнавання, якая падзяляе кожнае малюнак на некалькі невялікіх «патчаў» (каб спыніць перавагу тэкстуры як асноўнай крыніцы інфармацыі) і прааналізаваць, якія доказы прапануе кожны з іх, выкарыстоўваючы некалькі розных алгарытмаў, каб потым проста сабраць усю інфармацыю без уліку прасторавых адносін паміж фрагментамі, інтэгруючы яе для атрымання характарыстык высокага ўзроўню.

Дакладнасць сістэмы аказалася дзіўнай, выяўляючы больш "чалавечы" прадузятасць і яшчэ больш доказ увядзення "шуму", што робіць яго больш эфектыўным у дачыненні да некаторых антаганістычных нападаў.