История человечества — это, по большей части, оглушительная тишина. Огромная доля нашего прошлого остается незадокументированной, а реконструкция тех эпох превращается для историков в тяжелую, порой невыполнимую задачу. Мы привыкли полагаться на археологию: мы откапываем черепки, фундаменты храмов и наконечники стрел. Это надежный метод, но он стоит невероятно дорого и жестко привязан к конкретной локации. Что делать, если материальных следов не осталось? Как услышать голоса тех, кто не вел понятных нам летописей?
Ответ кроется в самом инструменте, которым мы пользуемся прямо сейчас. В языке. Идея использовать слова для восстановления истории не нова: еще в 1765 году философ Лейбниц утверждал, что именно этот метод лучше всего подходит для определения того, откуда произошли народы. Спустя двести лет лингвистический анализ назвали одним из триумфов науки. И лингвисты действительно знают: словарь любого общества подобен годовым кольцам дерева, он хранит свидетельства нашего прошлого, отражая революции, открытия и трансформации.
Особенно ценны для историков заимствованные слова — те, что были переняты у другой социальной группы на определенном историческом этапе. Присутствие такого слова — это прямой индикатор внешнего влияния. Взгляните на Лахмидское царство, существовавшее на территории современной Саудовской Аравии в 300–600 годах нашей эры. Историю этого арабского государства реконструировать крайне сложно, но именно заимствования помогают отследить корни его институтов. Лахмиды переняли персидское влияние: главный символ их королевской власти — корона — был персидским импортом, как и само арабское слово «тадж» (taj), обозначающее эту корону. Одно-единственное слово, словно найденная в пустыне золотая монета, доказывает, что концепция монархии подверглась влиянию персидских идей.
Однако на протяжении десятилетий этот метод вызывал жаркие споры. Скептики называли семантическую реконструкцию лишенной строгости, произвольной и зависящей от личных интерпретаций исследователя. Чтобы покончить с этими сомнениями и перевести лингвистическую историю в плоскость точных данных, экономисты Артур Блуэн и Джулиан Дайер внедрили подход, основанный на машинном обучении ("Реконструкция истории: использование языка для оценки распространения религий", 2025). Они решили автоматизировать процесс и создать нейросетевую модель, которая сама находила бы религиозные заимствования в тысячах мировых языков.
Почему именно религия? Во-первых, слова, связанные с верой, есть практически во всех языках. Во-вторых, религия — важнейшая черта глобального ландшафта, формировавшая общества тысячелетиями. Взяв за основу объективную классификацию Библиотеки Конгресса, исследователи выбрали базовые английские слова — такие как «молиться» (pray), «священник» (priest), «дух» (spirit) — и с помощью алгоритмов семантического сходства раскинули эту сеть на сотни других языков. Алгоритм начал искать, кто у кого «украл» или перенял эти слова, формируя гигантскую карту языкового влияния.
Но любую теорию нужно проверить на бесспорных фактах. Для проверки своей методологии ученые выбрали ислам и буддизм — религии, чьи исторические и географические истоки хорошо известны и никем не оспариваются.
С исторической точки зрения, буддизм зародился там, где проповедовал Сиддхаттха Гаутама (Будда) — в бассейне реки Ганг, недалеко от его места рождения в Лумбини (ныне граница Непала и Индии). Ислам же берет свое начало на Аравийском полуострове, где в седьмом веке в Мекке и Медине проповедовал Мухаммед.
Машина ничего не знала об этих исторических справках. Она анализировала только фонетику, написание и потоки заимствованных слов. И результат оказался ошеломляющим: алгоритм определил точки происхождения обеих религий с погрешностью менее чем в 500 километров от их истинных центров. Для сравнения: если убрать из уравнения лингвистическую информацию и опираться на случайные данные, промах составил бы более 1300 километров. Доказательство было получено: в языках действительно зашифрована точная историческая информация.
Но затем Блуэн и Дайер направили свой инструмент на более сложные, запутанные и дискуссионные случаи: христианство, иудаизм и индуизм. Здесь история перестает быть линейной. Главная проблема этих верований в том, что место, где религия родилась (где ходили пророки и жили первые адепты), кардинально отличается от места, где были написаны и канонизированы их главные священные тексты — писания. Возник фундаментальный вопрос: что именно отслеживает язык — устное распространение веры через проповеди или письменное распространение через канонический текст?
Рассмотрим иудаизм. Физической колыбелью этой религии, местом объединения племен и создания Израильского царства, являются земли к западу от реки Иордан, близ Иерусалима. Однако каноническое иудейское писание было собрано и записано совершенно в другом месте — в Вавилоне, куда евреи были отправлены в изгнание и где они кодифицировали свои законы, чтобы сохранить традиции. Когда языковая модель обработала массивы данных, ее геометка легла не на Иерусалим. Компьютер уверенно указал на земли древнего Вавилона. Дистанция от оценки алгоритма до источника писания оказалась более чем в два раза (а в некоторых калибровках — в четыре раза) короче, чем до Иерусалима.
Похожая картина сложилась и с христианством. Религия зародилась в Иерусалиме и его окрестностях, где происходили события из жизни Иисуса Христа. Но создание кодифицированного христианского писания — Нового Завета — произошло далеко от этих мест. Евангелия писались на греческом языке (а не на арамейском, на котором говорили первые ученики), проповеди активно вел грекоговорящий Павел, уроженец Передней Азии, а первая Библия формировалась в Александрии. Языковые алгоритмы снова проигнорировали Иерусалим. Модель Блуэна и Дайера показала, что лингвистическое влияние христианства исходит из исторически греческих регионов и монастырских центров Средиземноморья.
Самым интригующим оказался индуизм — древнейшая из рассматриваемых религий, чье происхождение неразрывно связано с загадкой миграции индоевропейских языков. Согласно господствующей «степной гипотезе», первые практикующие индуисты пришли из Понтийско-Каспийской степи, к северу от современной Турции. Но где зародилось само священное писание? У историков есть две основные теории: либо это Бактрийско-Маргианский археологический комплекс (территория современного Афганистана), либо долина Инда, куда мигранты принесли свои верования позже. И снова языковая модель поставила точку в споре: она полностью исключила Понтийскую степь. Обе калибровки алгоритма указали на юг Центральной Азии, охватив долину Инда и вплотную приблизившись к Бактрийско-Маргианскому комплексу. Модель оказалась в шесть раз ближе к месту создания текстов, чем к месту зарождения самого народа.
Вывод, который делают исследователи, переворачивает наши представления о том, как работает память человечества. Анализ языковых изменений и заимствований выявляет не географическое происхождение самого исторического феномена (или народа), а текстовое, каноническое происхождение идей. Лейбниц ошибался, считая, что язык лучше всего подходит для поиска прародины этносов. Слова, передающиеся от племени к племени, несут в себе не кровь и не пыль дорог первопроходцев. Они несут в себе стандартизированную мысль, институционализированный порядок, закрепленный в священных текстах и манускриптах. Язык фиксирует распространение концепции, а не человека.
И здесь кроется невероятная ирония, которая подводит нас к неожиданному финалу. Сегодня мы восхищаемся тем, как машинные алгоритмы и нейросети анализируют миллионы слов, чтобы найти источник древних священных текстов. Но прямо сейчас, в эту самую минуту, эти же самые алгоритмы перестали быть просто инструментом наблюдения. Синтезируя ответы, генерируя тексты, переводя и компилируя знания, искусственный интеллект массово внедряет в наши языки новые словесные конструкции, кальки и заимствования.
Представьте историка, который через тысячу лет запустит подобную программу, чтобы найти истоки глобального мировоззрения начала XXI века. Алгоритм будущего начнет распутывать нити наших «заимствований» и искать место, откуда исходило самое мощное стандартизированное влияние на умы. И он укажет не на площади, где бушевали революции, и не на столицы государств. Он с идеальной точностью в 500 километров укажет на координаты безликих серверных ферм где-нибудь в пустыне Невады или на дне океана. Потому что язык всегда безошибочно следует за Писанием, даже если в нашей эпохе это Писание впервые создано машиной.
Задонатить автору за честный труд
Приобретайте мои книги в электронной и бумажной версии!
Мои книги в электронном виде (в 4-5 раз дешевле бумажных версий).
Вы можете заказать у меня книгу с дарственной надписью — себе или в подарок.
Заказы принимаю на мой мейл cer6042@yandex.ru
«Последняя война Российской империи» (описание)
«Суворов — от победы к победе».
Мой телеграм-канал Истории от историка.