Если есть возможности, желание и время, то очень рекомендую почитать довольно объёмный, но крайне интересный материал о том, каких достижений достигло человечество в 2017 году по направлению компьютерного зрения. Мы, люди, примерно 90 % информации получаем через визуальные каналы, и именно потому компьютерное зрение является важнейшей частью технологий Искусственного Интеллекта. Нервные пути, передающие визуальную информацию, являются очень массивными, ну а сама зрительная кора имеет самую сложную структуру и взаимосвязи с окружающими и дальними частями головного мозга.
Предлагаемый мною материал написан на английском языке и представляет собой довольно сложное чтение, но оно того стоит. Могу сказать, что самый большой объём достижений получен при помощи применения современной архитектуры искусственных нейронных сетей, и сейчас я говорю о сетях глубинного обучения, особенно свёрточных. Так что из представленного материала можно узнать следующее:
- О том, как распознаются образы, как они классифицируются и локализуются на картинке, в том числе когда на одном изображении имеется много таких образов.
- О том, как происходит детекция инцидентов и объектов на изображениях, а также как делается трекинг в видеоинформации.
- О том, какие методы применяются для сегментации изображений, что крайне важно для таких систем, как автономные автомобили, системы видеонаблюдения, видеоаналитики и безопасности.
- О том, что сегодня используется для генерации и исправления изображений, наложения стилей и применения иных методов машинного творчества.
- О том, как происходит восстановление объёмной картины мира, которую, как известно, глаза человека и видеокамеры ИИ видят как плоское изображение?
- Ну и, наконец, в самом конце материала преподносится описание разнообразных архитектур нейронных сетей, которые применяются в рамках компьютерного зрения.
Так что категорически советую ознакомиться.