Набор данных MALDI-ToF.
Программное обеспечение FlexAnalysis версии 3.3 (Bruker Daltonics) использовалось для выполнения пост калибровки анализа спектров MALDI-ToF в точке калибровки, расположенной ближе всего к анализируемому образцу. Затем спектры были нормализованы и экспортированы в текстовые файлы с помощью mMass, средства интерпретации масс-спектрометрии с открытым исходным кодом.
Три аналитических реплики были усреднены, и все значения m/z, соответствующие общим загрязнителям (кератин, трипсин, α-цианоматрица ИМАД), были исключены из дальнейшего анализа. Остальные значения m/z были изучены с целью определения моно изотопного пика для каждого распределения и затем использованы для построения матрицы примыкания. В этой матрице указаны значения m/z, которые являются общими для таксонов и уникальными для определенного вида.
Набор данных LC-MS/MS.
Данные LC-MS/MS, полученные из 62 эталонных образцов, были проанализированы с помощью PEAKS 7.5. Поиск файлов талисмана общего формата (mgf) проводился по открытой справочной базе данных протеомов птиц, загруженной с сайта NCBI. В целях ускорения биоинформационного анализа поиск ограничивался под базами данных, содержащими:
- Протеомы всех таксонов для рассматриваемой птицы (например, все Ансериформы для Anas platyrhynchos);
- Протеомы всех Struthioniformes и Gallus;
- Все общие загрязнители (cRAP; общее хранилище адвентивных белков).
Поиск предполагал отсутствие пищеварительного фермента и имел допуск по массе ионов фрагментов 0,06 Da и родительский допуск по массе 10 ppm. Результаты, полученные в ходе поисков СПАЙДЕР (включая все модификации), использовались для идентификации белков с использованием следующих пороговых значений для принятия высококачественных пептидов: порог ложного обнаружения 0,5%, баллы -10lgP ≥ 40, баллы последовательности de novo (ALC %) ≥ 80. В результате было идентифицировано 57555 уникальных идентификаторов белка.
Объединение наборов данных MALDI-ToF и LC-MS/MS.
Значения m/z (уникальные и совместно используемые образцы в нашем наборе данных), определенные на основе данных MALDI-ToF, были непосредственно сопоставлены со списком 209 117 возможных заряженных пептидных масс, полученных с помощью ЖХ-МС/МС и определенных в результате биоинформационного анализа (53 612 уникальных пептидных последовательностей). Поиск ограничивался последовательностями, найденными в этом таксоне (например, значения m/z, найденные в Анасе, соответствовали только пептидам, идентифицированным в Анасе), с широким допуском ±0,1 Da. Для выбора наиболее вероятного соответствия в тех случаях, когда многим последовательностям пептидов может быть присвоено одно и то же значение m/z в интервале 0,1. Да, учёные оценивали каждую из возможных комбинаций, принимая во внимание: количество экспериментальных реплик, в которых определенная последовательность была идентифицирована, балл идентификации для пептида, количество спектров и наличие "необычных" модификаций. Учёные ожидали, что белки будут подвергаться пост трансляционным модификациям как в процессе формирования зрелого белкового продукта, так и в процессе диагенезе (окисление, дегидратация, деамидация) или подготовки образцов (карбамидометилирование). Любые редкие модификации вряд ли будут частой чертой пептидных последовательностей, обнаруженных в археологических раскопках.
Исследования показали, что некоторые белки яичной скорлупы очень похожи или хорошо сохраняются среди широкого спектра таксонов птиц. Например, белок "BPI складка, содержащая четвертого члена семьи В", признан в 55 птичьих таксонах и может быть очень хорошо консервирован. Поэтому все выявленные пептидные маркеры были проверены по всей базе данных NCBI (доступна 15/12/2017) и их встречаемости в других организмах (птицы, а также, например, млекопитающие, бактерии). Этот анализ позволил оценить таксономический уровень идентификации, достижимый для каждого маркера.
В целом, учёные подчеркивают, что хотя использование значений m/z в качестве маркеров может быть чрезвычайно полезным для таксономической идентификации некоторых археологических субстратов, сложность и изменчивость протеома яичной скорлупы таковы, что использование маркеров известной пептидной последовательности является предпочтительным. Тем не менее, ограничения этого подхода очевидны: сотни видов птиц, каждый из которых имеет свои экологические требования и поведение, могут присутствовать на любом археологическом объекте.
Для решения значимых вопросов, связанных с взаимодействием человека и птиц в прошлом, необходима идентификация на уровне рода или вида. Эталонная коллекция должна быть расширена по ширине и глубине и должна идти в ногу с прогрессом в области геномики птиц, что будет иметь решающее значение для оценки способности маркеров различать близкородственные виды.