Целью данной презентации является не демонстрация или гипотезы о сложном программном обеспечении ГИС для археолога, но, скорее, обсудить логическую подготовку, необходимую для записи на компьютерной записи сложного объекта. Объект, который изучается учеными, специализирующимися в нескольких различных областях, каждая из которых имеет свои собственные требования к сбору и обработке данных.
Что касается сбора и обработки данных, задача состоит в том, чтобы создать исчерпывающую, компьютеризированную базу данных по объекту, как графической, так и текстовой, начиная с артефактов и архитектуры, которые уже известны, а затем обеспечить рамки и процедуры, которые позволят добавлять новые открытия по мере их появления.
Если уже проделана большая работа, то создание баз данных о находках и создание CAD-чертежей архитектурных элементов.
Непосредственная проблема будет заключаться в том, что этой информации для удобной регулярной обработки слишком много.
Чертежи CAD могут быстро выйти из-под контроля, когда слишком много линий и в попытке создать модель, которая "похожа" на нарисованные от руки планы участка, к которым мы привыкли, то базы данных могут представлять собой проблему, то есть логику, при которой она была использована при ее первоначальной организации необходимо изменить, чтобы учесть пересмотренный набор данных. На самом деле вопрос заключается в следующем:
"Какие типы данных у нас есть и в каком формате их лучше всего хранить и извлекать?
Пытаясь определить идеальный набор данных и выбрать лучшее аппаратное и программное обеспечение для этой работы, необходимо помнить, что ситуация неизбежно будут меняться. Оборудование, программное обеспечение, финансирование, экскаваторы и фокус будут меняться в ходе долгосрочного проекта.
И, в свою очередь, приведут к изменениям в системе. Это означает, что гибкость внутри системы и легкая конверсия из нее должны быть приоритетами.
В связи с этим возникает концепция наименьшего общего знаменателя. A система простых программ, объединенных простой логикой, с гораздо меньшей вероятностью приведет в тупик, чем новейшая и современная система, точнее новейшее высокотехнологичное решение. Это также намного дешевле и намного легче интегрировать новых людей, таких как нескончаемый поток студентов и волонтеров, которые работают на типичном сайте. Это может отсечь многие действительно интересные программы и может потребовать отказа от некоторых функций в других подходящих программах (например, мемо-поля базы данных), но вы не можете позволить себе иметь такие ценные активы в чужой, проприетарной корзине.
Примером того, что я имею в виду, является файл .DBF. Этот формат существует давно и большинство программ баз данных его читают.
Выбор программы базы данных, которая также может его записывать, должен обеспечить возможность конвертации в будущем или обмена с коллегами работающими на других системах геодезических расчетов. В САПР форматы .DWG или .DXF, используемые в Autocad.
Autocad наиболее близки к этому идеалу (по крайней мере, для ПК), хотя Autodesk не удалось сохранить полную совместимость форматов файлов даже между версиями своего собственного программного обеспечения. Поэтому необходимо быть очень осторожным при переводе данных для других или при обновлении или замене программного обеспечения.
Программы резервного копирования являются хорошим примером того, что может произойти.
Сжатые с помощью команды DOS "backup", часто не могут быть восстановлены в версиях DOS, отличных от той, в которой они были созданы, и есть люди, которые обновили свою DOS без восстановления и повторного сжатия старых резервных копий. Чтобы быть в безопасности, при архивировании данных "для потомков" копии программного обеспечения, которое их создало, и операционной системы, которая поддерживала это программное обеспечение, могут потребоваться для надежного восстановления среды, которая может обеспечить успешное восстановление. Возможно, даже сам компьютер должен быть частью пакета. Это непростая тема, хотя в настоящее время в этом вопросе ведется хорошая работа над этим вопросом.
Самым низким из этих "низших" общих знаменателей является имя файла DOS имя, восемь символов с трехсимвольным расширением, которое часто экспроприируется программным обеспечением. Системы MAC и Unix не имеют этого ограничения, и DOS, несомненно, снимет его со временем, но многое можно сказать за то, чтобы имена файлов были короткими и осмысленными.
Короткие и содержательные: а много ли смысла можно вместить в восемь символов?
Один символ может обозначать проект геодезической съемки, район, год, траншею или экскаватор, раскопщика, а три цифры, добавленные к трем или четырем предыдущим, создают уникальный индекс с возможностью варьирования. Эти кодированные имена файлов помогают упростить систему, так как они обеспечивают последовательность. Важно то, чтобы все имена файлов были уникальными (не рассчитывайте на то, что структура каталога поддерживает разделение) и что одна и та же позиция в строке всегда означает одно и то же. Если придерживаться этого подхода, такие программы, как Dbase, могут надежно превратить эти коды обратно в слова, когда требуются отчеты, нужно будет совершать действия равносильные подвигу, что бы в них разобраться.
Пользователи поначалу будут сопротивляться, но я подозреваю, что каждый, кто не хочет выучить восьмизначный код, станет обузой для общей работы.
Еще кое-что, что следует помнить об именах, - это то, что не всегда очевидно, какие имена нужно рассматривать как имена файлов. CAD символы, например, не ограничиваются восемью символами, но если они длиннее, то не могут быть записаны на диск для использования в других чертежах без предварительного переименования.
Более того, существуют другие системы САПР, которые требуют, чтобы все символы должны быть отдельными файлами для целей перевода. Слои тоже часто выигрывают от превращения в отдельные рисунки для архивных целей или для создания файла меньшего размера, чтобы ускорить работу. Здесь необходимость сохранения связи порожденного чертежа с его источником требует, чтобы имя слоя было достаточно коротким, чтобы можно было добавить префикс обозначающий родительский чертеж или проект.
Инструменты, которые я выбрал, по крайней мере, на данный момент, следующие: Autocad будет векторным инструментом; но для того, чтобы свести существующие файлы чертежей до пригодного для использования размера, можно сделать две вещи.
Во-первых, изобразительные линии должны быть разделены на более мелкие чертежи "областей" и "элементов", которые хранятся отдельно и запрашиваются по мере необходимости из другого, почти пустого, чертежа с помощью новой надстройки ADE в Autocad. Затем, чтобы сохранить "вид" участка на экране, эти чертежи могут быть превращены в однобитные растровые файлы формата .MIL (поскольку здесь нет данныхтак как здесь не хранятся данные, необычный формат не является проблемой). Эти создаются и отображаются с помощью TERNOVLY, стороннего дополнительного приложения.
DBaseIV является основным инструментом для работы с базами данных, хотя DBaseIII будет работать так же хорошо, потому что поля мемо в DBaseIV не являются функцией, которая поддерживается Autocad.
Кроме того, имеется ряд утилит, таких как подсмотрщики, редакторы и целый ряд макросов, скриптов, пакетных файлов и т.д., которые используются для интеграции пакета.
Возвращаясь к первым принципам, следует задать следующие вопросы:
Какие типы вещей мы знаем?
Что еще мы можем узнать?
Какой способ хранения данных является наиболее эффективным?
Как мы собираемся получить доступ к этим данным и как мы собираемся распространять их среди коллег и для публикации?
Археология добавляет этот слой документации к находке, где она сначала записывается в виде полевого блокнота, затем переводится в файлы и форматы, используемые компьютером. Конечно, каждое наблюдение, комментарий или мысль должны быть сохранены в записях, но при подготовке этих, предварительных, данных для компьютерного ввода не следует ожидать (или не следует ожидать (или принимать) качественных решений от раскопщиков. Каждая находка должна рассматриваться как анонимный объект, который должен быть связан с датой раскопок, траншеей, пластами и примечаниями. Категория материала должна оставаться общей (т.е. камень, а не сланец или сланцы) с уточнениями, если они известны, упомянутыми в примечаниях регистратора. Цель состоит в том, чтобы создать безошибочную (пусть и ограниченную) базу данных, которая будет регистрировать каждый объект и обеспечит соответствующую информацию для последующей интерпретации без проблем, вызванных ложными следами, которые могут быть вызваны неопытности, поспешных суждений или принятия желаемого за действительное.
Этот слой данных будет расти очень быстро, но с ним никогда не придется иметь дело поэтому он должен быть идеальным, иначе все будет неправильно расположено.
После дня работы в траншеях полевые записи, которые велись во время раскопок, должны быть немедленно переписаны в ряд компьютерных файлов.
Первый - это "символический" чертеж CAD для данной траншеи. Это отдельный чертеж только одной траншеи, поддерживаемый экскаваторами, где символы, представляющие материалы, вставлены с точным расположением и масштабными коэффициентами по X, Y и Z и уникальный номер находки (AtyF###), указанный в поле, вводится в качестве атрибута. Кроме того, символы единиц раскопок вставляются с коэффициентами масштаба X, Y, Z, как записано в полевых записях, и здесь снова вводится уникальный номер ЕС (AtyU###). Эти символы вставляются в слои, названные в соответствии с полевыми записями.
Возможные варианты: экскаватор, дата раскопок, раскоп единица, номер страницы полевой книги, все, что требуется в качестве поля в дампе данных, который должен быть извлечен из чертежа CAD.
Опять же, все это должны быть эмпирические значения, на этом этапе ничего не вводится, что могло бы измениться по какой-либо причине. Например, дата раскопок всегда будет соответствовать этому критерию, в то время как историческая дата какой бы широкой или вероятной она ни была - нет. Такие записи должны будут сделаны позже.
Далее идут сопутствующие текстовые файлы. Здесь любые заметки или наблюдения, сделанные раскопщиками, должны быть переписаны в простой текстовый файл в формате ascii (еще один наименьший общий знаменатель) и дать имя файлу, связывающее его с объектом, который он описывает. Таким образом, текст, описывающий единицу раскопок, станет AtyU###.R## (символ .R## означает регистратор/номер и отличает эти заметки сделанные в полевых условиях, от аналогичных файлов, созданных теми, кто интерпретирует находки, которые имеют расширение .I##). Текст, описывающий находку, будет называться AtyF###.R##. Само собой разумеется, что сам текст должен содержать ссылку на уникальный номер, чтобы для защиты от опечаток в имени файла, а также следует всегда внимание на сообщения "файл уже существует...".
Традиционная очистка полевых заметок будет проводиться во время транскрипции на компьютер, но не стоит поддаваться искушению исправить оригинальные заметки. Вполне возможно, что такие "исправления" могут содержать ошибки, и если такая ошибка будет обнаружена позже, не будет никаких подсказок о ее происхождении, если полевые заметки были изменены.
Мы привыкли находить ошибки в любом наборе данных; но природа и характер ошибок в базе данных отличается от тех, которые могут быть найдены в текстовом файле, и мы не так быстро замечаем эти нестандартные не к месту возникающие ошибки.
Изображения траншеи, такие как особенности и более крупные находки, полученные с помощью камеры CCD, будут обрезаны и сохранены как растровые файлы GIF и названы тем же уникальным ID # (Aty?###?.GIF). Буква , следующая за идентификационным номером, предназначена для нескольких изображений одного и того же объекта или ЕС (Aty?###a).
Последней задачей записи, выполняемой в САПР, является подготовка связей с базой данных. Они включают в себя экспорт данных атрибутов на символическом чертеже в плоский файл с помощью команды
AutoCad команды "ATTEXT" (ATTribute EXTract) для последующего импорта в базу данных и преобразование данных атрибутов в формат расширенных данных сущности (EED), используемый AutoCad Data Extension (ADE). Последнее выполняется с помощью вариации команды PPAKATT2EED из пакета утилит AutoCad пакета PowerPak.
Это упражнение по вводу данных звучит гораздо сложнее, чем есть на самом деле. Ввод данных таким образом не займет больше времени, чем составление тщательных полевых заметок, которые были нормой в прошлом. Один час для каждого из раскопщиков должен решить вопрос с находками за день.
Ограничивающим фактором могут быть навыки работы с клавиатурой у раскопщиков, но, нравится вам это или нет, но как только вы перейдете на компьютер, клавиатура станет точкой доступа, по крайней мере, для ввода данных.
В прошлом неразборчивый почерк мог дисквалифицировать человека для выполнения определенных задач; небрежный ввод данных в компьютерной системе является еще большей проблемой, поскольку здесь даже человек ответственное лицо часто не в состоянии дать правильную интерпретацию.
Интерпретация/управление. . . . . . . . . . . . . . . . . . . День 2
Необходимо выполнить еще несколько задач по управлению данными, прежде чем приступить к прежде чем приступить к настоящей работе по интерпретации материала предыдущего дня. с максимальной эффективностью.
Во-первых, есть относительно простая задача добавления плоских файлов, извлеченных из чертежа CAD, в базу данных, таким образом определяя поля для Находок . Это дело нескольких минут в программе DBase. Затем возникает проблема эскизов, фотографий и других не цифровых изображений. Все, что обсуждалось до сих пор, может быть сделано вполне удовлетворительно на ноутбуке; но пленка должна быть обработана, напечатана и сканирована, прежде чем она станет доступной в электронном виде, а эскизы, сделанные на месте, должны быть либо переведены в CAD, либо отсканированы.
Даже видеозаписи требуют использования фреймграббера - оборудования, которое в настоящее время недоступно для ноутбука.
Характер раскопок вполне может исключать эти действия, либо из-за отсутствия оборудования (темных комнат, грабберов кадров и сканеров) или времени (CAD-эквивалент эскиза - это не быстрое и простое упражнение, как вставка символов). Поэтому приходится идти на компромиссы, пока мы ждем технологию, которая облегчит эти проблемы.
Фотографический вопрос может быть решен путем получения CCD-изображений всего, в дополнение к пленочной фотографии. Для этого используется Logitec Photoman Plus, который обеспечивает приемлемое разрешение, а также значительное преимущество хранения своих изображений в цифровом формате (таким образом, не требуя использования граббера кадров) хорошим и недорогим решением. Когда фотографии будут доступны они могут быть отсканированы и использованы для обновления или дополнения более ранних изображения. С другой стороны, зарисовки и видеозаписи будут, пока не появится соответствующая технология, возможно, в коммерции.
Таким образом, работа по интерпретации начинается с актуального чертежа CAD, содержащего символические изображения всех находок на сегодняшний день и соответствующей базы данных, показывающей материал, местоположение, размер и уникальный номер.
Эти объекты могут быть просмотрены как в Autocad, так и в базе данных, буквально одним нажатием кнопки. С помощью этих инструментов интерпретаторы могут заниматься своим делом, добавляя информацию в базу данных.
Ожидается, что переводчики и менеджеры будут использовать CAD Query drawing в качестве фронтэнда для доступа к базе данных. Это делается с помощью ADE для извлечения нужных данных из всей базы данных чертежей в достаточно небольших группах, чтобы сохранить размер чертежа и он был управляемым. С помощью запроса к этим извлеченным объектам их записи в базе данных могут быть просмотрены, обновлены и связаны растровые изображения и текстовые файлы, если они существуют, можно просматривать и/или редактировать. Вся эта информация доступна одновременно, к ней можно обращаться во время интерпретации материала и для принятия решений относительно хода работ.
Позднее "интерпретационные" чертежи CAD стен, помещений, могил и т.д. могут быть разработаны на основе регистрационных чертежей, дополненных вклад интерпретаторов, а на основе чертежей записей могут быть разработаны чертежи высот, разрезов и чертежи пластов на основе размещения символов ЕС и в конечном итоге это приведет к презентационным чертежам и публикации, по-прежнему работая почти исключительно в электронном форматах.