Найти тему
Новое электричество

Пиксель за пикселем

Image by Tumisu from Pixabay
Image by Tumisu from Pixabay

Почти все имеют представление о том, как компьютер хранит графическую информацию. Есть какое-то количество точек с уникальными координатами по вертикали и горизонтали («пикселей»), для каждого из которых известен его цвет (для тех, кто любит во всем порядок, уточним, что цвет сохраняется в виде интенсивностей красного, зеленого и синего цветов).

Самая первая наивная идея, как мог бы работать AI-распознаватель изображения, следующая. Алгоритму показывается огромное количество изображений (продолжая предыдущий пост, пусть это будут только изображения людей и лошадей). При этом для каждого из них ему сообщают правильную классификацию — человек это в итоге или лошадь? Дальше он сам составляет модель, которая в зависимости от цвета в разных пикселях определяет позволяет предсказывать вид объекта. Когда он видит новое изображение, его рассуждение будет примерно таким: точка (1,1), цвет коричневый — 60%, что это лошадь; точка (23,45) — 80% человек; точка (154, 87) — 55% человек. Дальше складываем вероятности по всем точкам и получаем итоговый результат  — 58%, что перед нами человек, сообщаем ответ (таким механическим голосом робота) — «пе-ред на-ми че-ло-век».

Может ли такой алгоритм быть эффективным? В принципе, да. Очень много вычислительной мощности и очень большая обучающая база, и можно добиться точности, приближающейся к 100%. Но сам описанный процесс далеко не оптимален, можно обучать AI намного эффективней. Как именно? Расскажем в нашем следующем посте.

#наука #технологии #искусственный интеллект #it #распознавание образов