4 подписчика

Распознавание речи, текста, изображений, а теперь и запахов - что уже может делать искусственный интеллект?

4 ноября 20194 ноя 2019

11 мин

Термин «искусственный интеллект» сопровождает нас почти везде сегодня. Наши компьютеры и смартфоны долгое время были «умными», теперь у нас также есть «умные» телевизоры и даже холодильники или стиральные машины. Интеллектуальные помощники позаботятся о нашем расписании задач, напомнят вам об ожидающем рейсе или сообщат вам об изменении погоды. Теперь мир распространился вокруг новостей о том, что Google научил искусственный интеллект распознавать запахи. Таким образом, восприятие машины возросло в другом смысле. Однако стоит поближе взглянуть на то, что искусственный интеллект уже может делать и как мы можем использовать его потенциал восприятия. Давайте начнем с последних новостей: Google объявил о создании искусственного интеллекта, способного распознавать запахи . Таким образом, под давлением машин упал еще один оплот человеческого восприятия. Машины уже могут видеть (распознавание лиц, распознавание объектов, текст и т. Д.), Слышать (распознавание речи, идентификация мелодий

Оглавление

ИИ распознает запах - как это возможно?
AI кодирование - программисту не хватает
Человеческий мозг, искусственный интеллект и парадокс Моравеки

Таким образом, восприятие машины возросло в другом смысле. Однако стоит поближе взглянуть на то, что искусственный интеллект уже может делать и как мы можем использовать его потенциал восприятия.

Давайте начнем с последних новостей: Google объявил о создании искусственного интеллекта, способного распознавать запахи . Таким образом, под давлением машин упал еще один оплот человеческого восприятия. Машины уже могут видеть (распознавание лиц, распознавание объектов, текст и т. Д.), Слышать (распознавание речи, идентификация мелодий и т. Д.), Теперь они также получили искусственный запах.

ИИ распознает запах - как это возможно?

Конечно, задача была не тривиальной. Теоретически, это должно быть так же просто, как с цветом. Как мы знаем, правильный цвет - это просто пучок электромагнитных волн точно определенной длины, который попадает в спектр, видимый человеческому глазу. Например, то, что наши глаза воспринимают как красный, вызвано излучением (фотонами) с длиной волны в диапазоне от 630 до около 780 нм (нанометров). Достаточно научить машину, что когда ее детекторы распознают луч этой длины волны, он должен «распознавать» красный цвет . Как просто так?

Другими словами, с ароматами, взвешенными в воздухе молекулами различных химических соединений, которые наше обоняние воспринимает как специфический запах. Вы можете собрать экспертов (например, из парфюмерной промышленности) и ученых (химиков и физиков), которые смогут определить, какой молекулярный состав данного вещества отвечает за какой аромат. Проблема в том, что человеческое восприятие не «ноль- один », один человек будет описывать данный аромат как «древесный» (что само по себе не очень точно), а другим тот же аромат будет описываться как «земной», Другая проблема заключается в различных свойствах химически идентичных соединений с различной хиральностью. Дело в том, что мы можем иметь две молекулы с одинаковым атомным составом, но зеркальным отображением молекулярной структуры относительно друг друга. Следовательно, мы имеем одинаковое химическое соединение, содержащее одинаковые составляющие элементы, но из-за разного расположения молекулы оно обладает разными свойствами, например, Не смотреть далеко: тмин и мята - это разные запахи, верно? Вещество с тем же химическим составом, но с разной молекулярной структурой отвечает за оба .

Фармацевтические компании были мучительно убеждены в важности не только состава, но и молекулярной структуры химического соединения в конце 1950-х годов. Затем под разными названиями на рынке появились безрецептурные анестезирующие препараты, также предлагаемые в более высоких дозах в качестве болеутоляющего средства для беременных женщин. Активным веществом в этих препаратах был талидомид, органическое химическое соединение, в котором частицы с зеркальным отражением (так называемые энантиомеры) имели совершенно разные эффекты. Один из энантиомеров обладал лечебным эффектом, а другой был очень сильным тератогеном (веществом, повреждающим плод)., Между тем безрецептурный препарат представлял собой рацемат, то есть он содержал смесь обоих энантиомеров этого химического вещества. Жертвами талидомида стали несколько тысяч детей, которые родились с серьезными дефектами.

Вернемся к искусственному интеллекту Google, способному распознавать запахи. Google использовал метод глубокого машинного обучения, который был подвергнут нейронной сети . Вкладом была обратная связь по запахам от человека и химическим данным для конкретных соединений. Давайте вернемся к основному вопросу: что сегодня может делать искусственный интеллект?

AI кодирование - программисту не хватает

Термин «искусственный интеллект» чаще всего описывает различные типы решений (чаще всего это подходящее программное обеспечение, работающее на каком-то конкретном оборудовании), возникающее в результате так называемого машинное обучение алгоритмам, отвечающим за функционирование конкретной программы . Разница между строительным кодом в результате классического программирования и машинного обучения является фундаментальной.

В первом случае программист - человек, создающий конкретное приложение, должен полностью предвидеть каждое его действие и строго определять его возможности. С машинным обучением все по-другому - это способ научить компьютеры тому, что вы не можете сделать самостоятельно . Разработчики, создающие IBM Big Blue или Alpha Go, то есть компьютеры, которые победили чемпионов мира по шахматам (Big Blue против Гарри Каспарова) и Go (Alpha Go против Ли Седола), конечно, играли хуже, чем мастера, побежденные компьютерами. Несмотря на это, искусственный интеллект, который они построили, смог победить мастера игры.

Человеческий мозг, искусственный интеллект и парадокс Моравеки

Искусственный интеллект, даже самый совершенный из существующих (мы, конечно, еще не знаем о многих секретных проектах), до сих пор не может сравниться с человеком. Наши знания - это не только способность логически обосновывать или математически доказывать теоремы. Это намного больше, чем это. Наш мозг также скрывает знания о восприятии и двигателе, которые мы часто не осознаем, Да, компьютеры давно превзошли самого умного человека во многих задачах: они считают быстрее, обрабатывают данные быстрее и т. Д. Но давайте возьмем, к примеру, распознавание изображений. Даже новорожденный ребенок может отличить лицо матери от лица незнакомца, со временем способность распознавать предметы в окружающем нас мире становится естественной, как и распознавание звуков, запахов или двигательных навыков (уже годовалые дети начинают делать свои первые шаги). Но у программиста, который перевел бы наши интуитивно почти приобретенные навыки на понятный для машин язык с помощью классических методов программирования, возникла бы реальная проблема. В классическом программировании обучение машине распознавания изображений или, например, ходячим роботам является невозможной задачей. Наконец, ответьте на вопрос самостоятельно: как ты научился ходить Просто так получилось, да? Такой информации для машины недостаточно.

Долгое время первые исследователи ИИ игнорировали этот чрезвычайно важный элемент - феноменальную способность человеческого разума учиться. Было признано, что искусственный интеллект будет соответствовать человеку, когда он способен выполнять, например, логические рассуждения. Программа «Теоретик логики», способная решать математические и логические задачи и доказывать теоремы, была создана в ... 1956! Неудивительно, что первые исследователи искусственного интеллекта были ошеломлены возможностями и предсказали скорое создание машины, которая соответствовала бы человеческому интеллекту. Как вы знаете, у нас 2019 год, и в мире до сих пор нет искусственного существа с общим интеллектом, равным среднему представителю homo sapiens. Это не хорошо с моторными навыками в одиночку. Конечно, у нас есть роботы, которые двигаются ненормально, но ни один из них не может ходить с милостью двухлетнего ребенка. И двухлетний мальчик не только умеет ходить и бегать, но он уже говорит, понимает, слушает и узнает свое окружение, цвета, запахи, людей, животных ...

В общем, первые исследователи смотрели не там, где им нужно было. Ханс Моравец, один из выдающихся исследователей искусственного интеллекта, обратил внимание на эту проблему. Он сформулировал предложение, которое сегодня называется парадоксом Моравека . В 1988 году Моравец писал:

Относительно легко заставить компьютеры демонстрировать навыки взрослого в тестах интеллекта или шашках, но сложно запрограммировать их навыки годовалого ребенка в восприятии и мобильности. - Ханс Моравец

ем не менее, сегодня интеллектуальные алгоритмы могут распознавать изображения, звуки, текст, а теперь и запахи. Как это возможно?

Нейроны - общий элемент биологии и технологии

Ранее мы упоминали, что Google получил эффективный «сниффинг» искусственного интеллекта благодаря методу глубокого машинного обучения нейронной сети. Что это на самом деле означает? Это перевод осознанного нашими умами способа обучения в мир машин. Нейрон - это тип нервной клетки, способной обрабатывать и проводить информацию, записанную в форме электрического сигнала., Мы можем быть медленнее, чем компьютеры, но наши соединения (то есть полная карта нейронных связей) чрезвычайно сложны, намного сложнее, чем самый совершенный компьютер. Подсчитано, что количество нейронов в мозге человека превышает даже 150 миллиардов, и каждый из них выглядит как очень разветвленное дерево, эти ветви являются дендритами, которых в каждом нейроне может быть до 10 тысяч. Количество возможных комбинаций соединений абсолютно невообразимо и намного больше, чем самая сложная структура самого большого в мире компьютера.

Тем не менее, то, как мы учимся на клеточном уровне, может быть сведено к относительно простому правилу укрепления связей между нейронами. Это открытие было сделано в 1949 году Дональдом Хеббом, канадским психологом, специализирующимся на нейропсихологии.

Сегодня многие компании, хвастающиеся искусственным интеллектом, одинаково охотно используют термин «нейронные сети» в маркетинговых сообщениях. Не случайно, что блуждание битов в алгоритмах искусственного интеллекта напоминает блуждание электрических импульсов в наших биологических нейронах. Именно картирование механизма нейронного обучения заложило основу для того факта, что сегодня можно использовать глубокое машинное обучение многослойных, сложных нейронных сетей . Однако только в этом возрасте методы машинного обучения были достаточно эффективными, и сами сети и вычислительная мощность компьютеров достигли уровня, когда машины могли наконец начать учиться распознавать изображения, речь и т. Д. Возникает следующий вопрос: зачем нам это нужно?

AI и распознавание образов

Распознавание образов было одной из основных задач, поставленных перед искусственным интеллектом. Фактически, это началось с изображений, но стоит помнить, что для машины не имеет значения, будет ли распознанный объект каким-либо конкретным объектом на фотографии, определенным звуком или упорядоченным набором экономических, геологических, климатических, личных, страховых или любых других типов данных. Все эти данные просто набор битов.

Тем не менее, мы начали изучать искусственный интеллект по распознаванию образов, что не должно вызывать удивления, потому что именно нашими глазами мы получаем наш мир в значительной степени. В 2012 году в лаборатории Google под названием Google X удалось создать искусственный интеллект, который «питал» миллионы снимков с YouTube, содержащих кошек, сам - без помощи человека - научился распознавать этих симпатичных четвероногих на изображениях .

Почему мы должны распознавать шаблоны? Машины без этого навыка не смогут выполнять много задач. Благодаря машинному обучению интеллектуальные алгоритмы могут, например, обнаруживать ранние изменения рака на диагностических изображениях с высоким разрешением . Их точность уже настолько высока, что они могут автоматически диагностировать изображение ткани более эффективно, чем многие квалифицированные врачи-диагносты. Конечно, все же именно человек решает вопрос о дальнейшем лечении и лечении, но благодаря искусственному интеллекту, который способен обрабатывать тысячи диагностических изображений намного быстрее и зачастую более точно, чем человек, последний может сосредоточиться на самом важном - спасении жизней.

Преимущество искусственного интеллекта, который освоил навык, состоит в том, что он может быть адаптирован к различным задачам. Хорошим примером является алгоритм Vision AI, то есть обученный искусственный интеллект Google, который предоставляется заинтересованным компаниям, стартапам и другим организациям, которые не могут разработать интеллектуальный алгоритм распознавания изображений, но имеют представление о том, как его использовать.

Например, AES, работающая в отрасли возобновляемой энергии, использовала автоматизированную армию беспилотников, оснащенную фотографическим оборудованием, для диагностики своих ветровых электростанций. Дроны покорно фотографируют состояние каждой из тысяч ветровых турбин вблизи, в результате чего в одном полете из нескольких десятков тысяч изображений. Ручной анализ, т. Е. Выполняемый группой людей, может длиться долго или потребовать найма большого количества специалистов. AES пошли другим путем, используя Google Vision AI для первоначального анализа изображений . Искусственный интеллект за очень короткое время способен обрабатывать десятки тысяч фотографий с высокой точностью, выделяя гораздо меньшее количество для проверки специалистом-человеком.

Есть тысячи подобных примеров. Без возможности машин распознавать шаблоны, мы не могли бы говорить о многих службах, таких как Google Assistant, который мы используем сегодня почти по незнанию, по крайней мере, не задумываясь о том, как за компьютером скрываются сложные технологии, чтобы компьютер мог понимать нас и отвечать на них.

суммирование

Подводя итог, можно сказать, что каждое восприятие машины полезно, потому что оно позволяет нам гораздо быстрее обрабатывать данные, полученные непосредственно из окружающей реальности. Больше нет необходимости «объяснять» машине, какие фрукты видны на фотографии - искусственный интеллект способен справиться с этим сам. И его полезность заключается главным образом в скорости обработки - ИИ, когда вы чему-то учитесь, делает это намного быстрее, чем человек. А запахи? Представьте себе на своем смартфоне будущего помощника Google, который говорит: «Эй, чувак, здесь что-то воняет» - по-человечески.

До того, как мы, обычные пользователи, сможем использовать искусственный интеллект любым способом, пройдет много времени. Джендак сегодня мы можем использовать интеллектуальные колонки, в которых скрыт личный помощник, поддерживаемый ИИ