Найти в Дзене
Политехнический музей

Как обрабатывали большие данные в XIX веке?

Инструменты для обработки big data — больших данных — появились совсем не в XXI, а ещё в XIX веке. Результаты переписи населения в Америке и России в позапрошлом столетии обрабатывались с помощью такой вычислительной машины. Счётные машины давно помогают нам с арифметическими расчётами. Прототип арифмометра встречается ещё на эскизах Леонардо да Винчи, а в XVII веке «считающие часы» Вильгельма Шиккарда уже использовались в астрономических исследованиях. К девяностым годам XIX века машинное счисление окончательно вошло в обиход. Механические арифмометры помогали легко справляться с четырьмя арифметическими действиями. Правда, уже тогда стало понятно, что для обработки больших объёмов статистических данных одной арифметики недостаточно. В 1897 году в России прошла перепись населения. Данные по каждому из опрошенных группировались по 14 пунктам. Для обработки такого огромного массива информации Центральный статистический комитет приобрёл вычислительную машину — табулятор конструкции Герма

Инструменты для обработки big data — больших данных — появились совсем не в XXI, а ещё в XIX веке. Результаты переписи населения в Америке и России в позапрошлом столетии обрабатывались с помощью такой вычислительной машины.

Счётные машины давно помогают нам с арифметическими расчётами. Прототип арифмометра встречается ещё на эскизах Леонардо да Винчи, а в XVII веке «считающие часы» Вильгельма Шиккарда уже использовались в астрономических исследованиях. К девяностым годам XIX века машинное счисление окончательно вошло в обиход. Механические арифмометры помогали легко справляться с четырьмя арифметическими действиями. Правда, уже тогда стало понятно, что для обработки больших объёмов статистических данных одной арифметики недостаточно.

В 1897 году в России прошла перепись населения. Данные по каждому из опрошенных группировались по 14 пунктам. Для обработки такого огромного массива информации Центральный статистический комитет приобрёл вычислительную машину — табулятор конструкции Германа Холлерита. Семью годами ранее он уже использовался в обработке материалов американской переписи.

В качестве носителя данных в машине Холлерита использовались перфокарты — по одной на каждого из участников переписи. Поскольку всего в переписи участвовало более 125 миллионов человек, сложно представить себе физический объём картона, ушедшего на это мероприятие. Карты пробивали на специальных перфораторах, после чего сортировальные машины упорядочивали их по тому или иному признаку. Далее данные поступали в сумматор, который подсчитывал общий результат.

Разумеется, даже такая продвинутая по тем временам техника не страховала от большого количества ошибок — карты часто заполнялись неправильно, а некоторые вопросы переписи и вовсе не вошли в анализ, так как для них не нашлось свободной ячейки. Тем не менее эта перепись стала важной вехой в развитии статистики в России.

Машина Холлерита уже не была чисто механической — для её работы необходимо было подключение к электросети.

В проекте Политехнического музея по созданию онлайн-коллекции «Штуки, механизмы и агрегаты Политеха» появляется всё больше оцифрованных экспонатов. Увидеть эти предметы и узнать историю их создания можно по ссылке, в разделе «Коллекция». Проект реализуется при поддержке мецената Руслана Горюхина.