Некоторые из следов нашего взаимодействия с археологическими материалами и организациями на базе Интернета можно свободно извлекать, приводить в порядок и анализировать.
Например, данные, полученные с общедоступных форумов и блогов, страниц Facebook, твитов и комментариев к видеоматериалам, размещенным на YouTube или Vimeo, могут способствовать изучению отношения и поведения к человеческому прошлому и его археологическим исследованиям, а газеты, журналы, телевидение и радио могут помочь выяснить, как и почему археология получила "институциональную" поддержку в различных геополитических, социальных и культурных условиях.
После сопоставимых экспериментов в области социальных наук можно даже разработать приложения, которые с помощью краудсорсинга и геймификации напрямую задают вопросы участникам о своем понимании, интересе или участии в изучаемой нами предметной области.
Информация, содержащаяся в этих "веб-архивах", может быть агрегирована для формирования очень больших, если не "больших" наборов данных, способных открыть новые аналитические пути.
Большие данные характеризуются не только впечатляющим объемом, но и большим разнообразием и скоростью, мелкозернистой и реляционной природой, а также большой гибкостью.
Для исследований, использующих теорию и методы социальных наук, как, например, в публичной археологии, этот поток данных позволяет перейти от традиционно резкого разделения количественных и качественных подходов к гораздо более гибким и интегрированным качественным количественным установкам и методологиям.
В доцифровом мире существовали бы два основных вида исследовательских стратегий, обширные и интенсивные.
Такой обширный вид работы предполагает сбор больших объемов данных для количественных видов анализа, которые, однако, также не могут быть "локомотивом", и непрерывное изучение эффекта от прохождения времени.
Обследования, например, полезны для сбора информации по нескольким случаям в один момент времени, и даже если один и тот же человек подвергается неоднократным опросам, метод исследования остается пунктуальным (измерение происходит в определенные дни и в определенные моменты).
Этнография позволяет проводить локомотивные исследования конструкций, но только в рамках "интенсивных" стратегий исследования. Последние полезны для изучения "микро-взаимодействия" по мере их развития, но отделяют их от понимания "макро-структур".
Цифровые средства массовой информации позволяют преодолеть описанный разрыв, что позволяет проводить как обширные исследования, так и исследования в области локомотивов: Большие веб-данные могут быть проверены количественно, не мешая при этом проводить столько наблюдений крупным планом, сколько необходимо, в потенциально непрерывном временном спектре.
Однако существуют, по крайней мере, три основные проблемы, которые могут ограничить потенциальное использование веб-архивов. Во-первых, это их доступность, поскольку не всегда возможно бесплатно добывать все имеющиеся данные.
Второй вопрос - это этика. Например, учреждения могут добывать личные данные пользователей через социальные логины, но вопрос о том, можно ли и как это сделать этичным образом, остается предметом горячих споров. Третий вопрос - удобство использования.
Данные, собираемые с помощью веб-платформ, часто деконтекстуализируются, как это происходит, например, в случае сообщений, которые нелегко увязать с соображениями, касающимися личных, социальных или физических "ниш", в которых они были созданы. Поэтому очень трудно понять, кто выражает определенные взгляды или проявляет определенное поведение.
Для устранения этого пробела было бы полезно рассмотреть возможность триангуляции или интеграции анализа "больших" или "очень больших" данных с проверкой более мелких данных.