Найти в Дзене

Как компьютеры научились видеть: тайны зарождения компьютерного зрения в 1960-х

Представьте: 1963 год, лаборатория MIT. На столе стоит громоздкий компьютер, подключенный к странному устройству с линзой и проводами. Ученые пытаются заставить его распознать квадрат на экране осциллографа. Машина ошибается, путает стороны, но вдруг... включается лампочка . Это был первый шаг к тому, чтобы компьютеры научились видеть. История компьютерного зрения — это не только технологии, но и дерзкие эксперименты, провалы, которые привели к революции. В 1950-х компьютеры были слепы. Они считали, решали уравнения, но не могли отличить круг от треугольника. Первым серьезным проектом стал «Глазофон» (1959), разработанный Лоуренсом Робертсом в MIT. Как это работало: Проблема: Система распознавала только простые фигуры. Для анализа фотографии требовалось несколько часов. Факт: Робертс позже стал одним из создателей Интернета (ARPANET), а его «Глазофон» назвали «первым шагом к зрению машин» . В 1966 году Марвин Минский, один из «отцов ИИ», задал студенту Джеральду Джей Сассману задачу: «
Оглавление

Машина, которая не знала, где верх

Представьте: 1963 год, лаборатория MIT. На столе стоит громоздкий компьютер, подключенный к странному устройству с линзой и проводами. Ученые пытаются заставить его распознать квадрат на экране осциллографа. Машина ошибается, путает стороны, но вдруг... включается лампочка . Это был первый шаг к тому, чтобы компьютеры научились видеть. История компьютерного зрения — это не только технологии, но и дерзкие эксперименты, провалы, которые привели к революции.

Глава 1: «Глазофон» и первые попытки

В 1950-х компьютеры были слепы. Они считали, решали уравнения, но не могли отличить круг от треугольника. Первым серьезным проектом стал «Глазофон» (1959), разработанный Лоуренсом Робертсом в MIT.

Как это работало:

  • Аналоговая камера снимала изображение, преобразуя его в электрические сигналы.
  • Компьютер анализировал контуры, разбивая картинку на линии и углы.
  • Результат выводился на осциллограф — черно-белый узор из векторов.

Проблема: Система распознавала только простые фигуры. Для анализа фотографии требовалось несколько часов.

Факт: Робертс позже стал одним из создателей Интернета (ARPANET), а его «Глазофон» назвали «первым шагом к зрению машин» .

Глава 2: Марвин Минский и «летний проект», который затянулся на десятилетия

В 1966 году Марвин Минский, один из «отцов ИИ», задал студенту Джеральду Джей Сассману задачу: «Сделай так, чтобы компьютер понимал, что он видит» . Это звучало просто, но превратилось в многолетний марафон.

Что они пытались сделать:

  • Создать алгоритм для распознавания объектов в реальном времени.
  • Научить машину отличать кружку от книги на столе.

Почему это было сложно:

  • Камеры тех лет (например, RCA Vidicon) давали размытые изображения.
  • Процессоры не справлялись с обработкой пикселей — приходилось упрощать задачи.

Курьез: Минский шутил: «Если бы я знал, сколько лет уйдет на это, назвал бы проект зимней депрессией » .

Глава 3: Стэнфордский «Стрелок» и распознавание лиц

В 1970-х в Стэнфорде создали систему «Стрелок» (англ. «The Shooter» ), которая распознавала рукописные символы. Это было прорывом:

  • Сканер разрешением 100×100 пикселей (меньше, чем иконка на рабочем столе) считывал буквы.
  • Алгоритм искал особенности: углы, кривые, толщину линий.

Парадокс: Система лучше распознавала почерк ученых, чем текст в газетах — из-за шума на старых ламповых сканерах.

Глава 4: «Машинное зрение» в Советском Союзе

СССР не отставал. В 1968 году в Институте кибернетики АН УССР разработали «Символ-1» — систему для распознавания печатных букв.

  • Как это работало: Камера с разрешением 64×64 пикселя передавала данные на ЭВМ «Киев-1».
  • Скорость: 1 символ в минуту.
  • Секрет успеха: Советские ученые использовали топологические признаки (например, количество «дырок» в букве «О»).

Факт: Технологии «Символа-1» позже легли в основу автоматизации почты в СССР.

Глава 5: Точка невозврата — алгоритм Sobel

В 1970 году Ирвин Собел из Стэнфордского исследовательского института создал оператор для обнаружения границ на изображениях (оператор Собеля ).

  • Он анализировал перепады яркости между пикселями.
  • Это стало основой для всех современных алгоритмов компьютерного зрения.

Ирония: Собел назвал свой оператор «скромным вкладом» , но сегодня он используется даже в Instagram для фильтров.

Глава 6: Почему это было революцией?

Казалось бы, примитивные системы 1960-х не сравнятся с нейросетями. Но именно тогда:

  • Заложили принципы: Разделение изображения на пиксели, выделение признаков, обучение на данных.
  • Создали инструменты: Алгоритмы вроде Собеля до сих пор учат на курсах по Computer Vision.
  • Доказали: машина может видеть.

Цитата Дэвида Марра (пионера компьютерного зрения): «Зрение — это не зеркало мира. Это активный процесс построения гипотез. И машины могут этому научиться» .

Эпилог: От сканеров к нейросетям

Сегодня компьютеры распознают лица, диагностируют рак на снимках, управляют Tesla. Но их «прабабушками» были те самые шумные сканеры, которые путали буквы «О» и «С».

P.S. В следующий раз, когда разблокируете телефон по лицу, вспомните: в 1960-х для этого потребовался бы целый этаж с компьютерами и неделя ожидания.

#КомпьютерноеЗрение #ИсторияТехнологий #ИИ #MIT #Стэнфорд #СоветскийИИ

Если хотите узнать, как ИИ научился слышать — готовлю пост о первых голосовых помощниках. Ставьте ❤️ и подписывайтесь!