Найти в Дзене
Минус фунт

534. НОВАЯ глоттоХРОНОЛОГИЯ

Оглавление

Статья названа Новая глоттохронология, но по факту новизна представляемого метода анализа языков на предмет выявления их взаимных связей (какой язык от какого произошел и когда) - возврат к выявленным в 1950-х годах основополагающим зависимостям, подвергнутым сомнениям немедленно после их манифестации, с неимоверным количеством попыток их поправить и улучшить. Ниже кратко история вопроса.

История глоттохронологии

Лингвисты, на протяжении свыше 2 веков изучавшие языки, подметили, что между языками существуют связи, которые позволяют объединять их в группы или более крупные образования - семьи, и что языки не остаются неизменными - они подвержены изменениям во времени.

Наиболее подвержен изменениям словарный запас языка, в котором можно выделить наиболее устойчивое к изменениям ядро языка, и менее устойчивые слова на его периферии. Американский лингвист Моррис Сводеш задался целью выделить в языке список из сотни-другой слов, наименее подверженных изменениям.

Моррис Сводеш (1909-1967)
Моррис Сводеш (1909-1967)

Этот отобранный список слов Сводеш назвал базисным словарным запасом. Список был составлен в основном интуитивно, постоянно дорабатывался, в него были включены местоимения (я, ты, мы), слова, выражающие отношения (большой, маленький), обозначающие части тела человека (ухо, глаз), цвета (красный, зеленый), числительные (один, два) и пр.

Предполагалось, что при миграции человеческих сообществ, социальных изменениях или технологических изменениях эти слова изменяться не будут.

Основная идея предложенного Сводешом метода глоттохронологии основывается на аналогии с предложенным незадолго до этого (в 1946 году) методом радиоуглеродного датирования, позволяющим оценивать возраст органических останков путем измерения содержания в материале радиоактивного изотопа 14C по отношению к стабильным изотопам углерода.

Сводеш выдвинул предположение, что основной список лексики языка (названный его последователями "списком Сводеша") распадается аналогично распаду радиоактивных материалов. Сводеш ввел понятие скорости изменения языка, которую счел постоянной, и как сам, так и его последователи, пытались определить скорость этого изменения.

Особенности распада основного списка лексики

Здесь следует сделать замечание, что понимается под скоростью изменения. Ввиду разной оценки этой скорости, даваемой в разное время разными исследователями для разных языков, приведем пример со скоростью изменения, оцененной нами (на вопрос, отчего мы считаем ее самой верной, отвечает данная статья).

Казалось бы, неизменная скорость изменения означает, что каждые 1000 лет из основного списка выпадает определенное количество слов, замещающихся новыми, пока список не заменится полностью. Но все далеко не так.

За 1000 лет основной словарный запас основного списка в 200 слов меняется на 13%, т.е. из 200 слов через 1000 лет сохраняется всего (1-0,13)*200=174. Как и радиоактивный материал, базовый список распадается по законам не линейного, а экспоненциального распада. Это следует понимать так, что если за 1000 лет сохраняется 87% исходного списка, за следующую 1000 лет распадется 13% от оставшихся 87% списка, т.е. в списке останется (1-0,13)*(1-0,13)*200=151 слово от исходных 200 слов, и т.д. График распада приведен ниже.

График распада основного списка лексики 200-словного списка
График распада основного списка лексики 200-словного списка

Для тех, кто дружит с алгеброй - если время изменяется по арифметической прогрессии, число сохраняющихся в основном списке слов изменяется по геометрической прогрессии, в рассматриваемом случае 200-словного списка со знаменателем геометрической прогрессии 0,869.

В 1946 году был предложен метод радиоизотопного датирования, применяемый для определения возраста органических останков путем измерения содержания в материале радиоактивного изотопа 14C по отношению к стабильным изотопам углерода. Сводеш на основе аналогии распада слов основного списка лексики с распадом радиоактивных материалов предложил посредством сопоставления списков основной лексики 2 современных языков и оценки коэффициента совпадения (процента общих слов в списках) определять время, когда эти 2 языка отделились от общего предка и стали развиваться самостоятельно.

Пора вернуться к работам классиков глоттохронологии. В одной из своих первых работ Сводеш привел список найденных рядом своих коллег коэффициентов сохранности ряда языков. Сравним 2 состояния языка, разделенные несколькими веками (тысячелетиями). В частности, современный румынский язык сравнивался с классической латынью, древневерхнемецкий язык сравнивался с современным немецким языком, латинский язык, на котором писал древнеримский автор комедий Плавт, сравнивался с французским языком, на котором писал французский драматург 17-го века Мольер, классическая латынь сравнивалась с испанским, португальским и итальянским языками.

Коэффициент сохранности лексики, в пересчете на 1000 лет, изменялся в пределах от 76% до 85%. Отметим, что оцененное нами значение коэффициента сохранности (87%) выше всех этих значений - это важное замечание.

На основании подмеченной Сводешем аналогии распада слов с радиоуглеродным распадом удалось решить и интересующую лингвистов задачу - сравнив основные списки 2 современных языков, по коэффициенту совпадения оценить дистанцию между языками, а поделив ее на 2, оценить время расхождения языков между собой (при условии, что они имели общего предка, как латынь считается предком всех романских языков- итальянского, испанского, французского, румынского и пр.).

Отделение одного языка от другого всегда условно, и полученное по методу Сводеша время разделения языков не всегда может быть привязано к какому-либо историческому событию, дата которого точно известна. Сравним 2 языка современной Индии - панджаби и хинди. Основные списки этих языков совпадают на 74,5%%. Принято считать, что если языки совпадают на 97% и больше, то это диалекты одного языка. При проценте совпадений менее 89% языки считаются самостоятельными языками, но вплоть до 70% совпадений носители языков осознают сходство своих языков. В качестве примера, примерно таково сходство между русским и чешским языками.

-4

При падении процента совпадений до 15-35% носители языков родство не осознают, но оно легко устанавливается специалистами путем изучения особенностей каждого языка. В качестве примера, на 35% русский язык совпадает с латышским, а на 15% с одним из языков Индии, сингальским. 5-10% совпадений - признак дальнего родства либо же совпадения могут явиться случайными. Так, армянский язык имеет с албанским всего 8-9% совпадений, родство этих языков установлено, они оба принадлежат к индоевропейской языковой семье (к которой принадлежат также и славянские языки, наряду с романскими, германскими и пр.). Причина такого большого расхождения между языками - древность армянского языка, развивавшегося самостоятельно и выделяемого в особую ветвь индоевропейской языковой семьи. В подобных случаях между специалистами зачастую возникают споры о языковом родстве, поскольку неслучайные совпадения трудноотличимы от случайных.

Возвращаемся к языкам панджаби и хинди. 74,5% совпадений позволяют считать панджаби и хинди самостоятельными языками, при этом носители языков ощущают сходство языков. Но принято считать, что друг друга они не понимают. Время расхождения языков вычисляется по формуле, но мы воспользуемся приведенным выше графиком. 74,5% совпадений 200-словного списка - это совпадение между языками на 149 слов, чему на графике соответствует время 2100 лет. Это время между разошедшимися на 74,5% современным языком и языком-предком. Но поскольку языки развивались параллельно и независимо, разошлись они 1050 лет назад. Так и принято считать, что панджаби возник как выродившаяся форма одного из диалектов санскрита в 7 веке нашей эры и стал стабильным к 10 веку. Самые ранние письмена на панджаби относятся к эпохе с 9 по 14 век.

Одновременно были определены границы применимости глоттохронологии - дату разделения считалось возможным определить, если это событие происходило до 5000-6000 лет назад. При коэффициенте сохранности 0,869 через 6000 лет в 2 языках с общим предком сохранится 18-19% общей лексики.

Метод Сводеша немедленно по своему возникновению подвергся критике. Возникли затруднения при переводе списка на различные языки, особенно далекие от европейской культурной традиции (что вынудило Сводеша сократить первоначальный 200-словный список до 100 слов, в дальнейшем исследователи сокращали его до 50 и 35 слов).

Исследователи пришли к выводу, что ни один из элементов основного списка не является абсолютно нейтральным и универсальным. Не случайно работающие со списком Сводеша исследователи оговаривают возможность ошибки в 2-3 слова при сопоставлении списков. По факту ошибка может быть еще больше. Но ни один метод измерения не может быть абсолютно точным. Вопрос в том, применима достигаемая точность измерения для практических целей или нет.

Вернемся к оцененным коллегами Сводеша еще в 1950-х годах коэффициентам сохранности лексики за 1000 лет - от 0,76 до 0,85. Выше мы писали, что считаем правильным коэффициент 0,869. Постараемся найти объяснение систематическому занижению коллегами Сводеша коэффициента сохранности.

Рисуем деревья

На рисунке ниже одно из первых т.н. лингвогенетических дерев индоевропейских языков (дендрограмм), составленное немецким лингвистом Августом Шлейхером (1821-1868) методами сравнительно-исторического языкознания.

Дендрограмма индоевропейских языков Шлейхера
Дендрограмма индоевропейских языков Шлейхера

Подобных дендрограмм было составлено неимоверное количество, но они все одномерные - языки изменяются во времени, иная координата изменений отсутствует.

Вернемся к радиоуглеродной аналогии - как изменится результат радиоуглеродного датирования, если образец окажется загрязненным? Загрязнением называется наличие в образце органического материала чуждого происхождения, который не был сформирован вместе с материалом образца. Наиболее известный случай, когда результат радиоуглеродного датирования был подвергнут сомнению, это анализ ткани Туринской плащаницы, датировавший ее средневековьем. Результаты анализа подвергаются сомнению на том основании, что плащаница подвергалась нагреву при пожаре и вывариванию в масле, что внесло в нее инородные материалы.

Так и с языками. Рассмотрим образование английского языка. Английский язык является западногерманским языком, возникшим на основе англо-фризских наречий, привнесенных в Британию в V—VII веках н. э. германскими завоевателями и поселенцами нынешней Северо-Западной Германии, Западной Дании и Нидерландов.

По составленной нами дендрограмме английский язык отделился от датского, но поскольку во время отделения не существовало ни датского, ни немецкого языков, отделение произошло от некоего общего предка всех германских языков, поскольку современные германские языки отделялись от ствола германских языков позднее.

Коэффициент совпадения между английским и датским языками составляет 59%. По графику 118 сохранившимся словам соответствует глубина времени 3800 лет, или время расхождения пары языков 1900 лет. Это конец 1-го, начало 2-го веков н.э. Британия в то время была заселена кельтами, а за порядком наблюдал присланный из Рима легион - Британия была одной из окраинных провинций Римской империи. После падения Рима в начале 5-го века владычество римлян в Британии прекратилось. После ухода римлян большая часть острова была завоевана в 5 веке германскими племенами англов, саксов, ютов и фризов. Древнеанглийский язык англосаксонской эпохи и явился отчетной точкой зарождения английского языка.

Но ведь глоттохронология дала датировку на 300 лет раньше? Что не так - компаративисты неправильно подсчитали степень совпадения языков, или расчет велся по неправильной скорости совпадения языка? Ради интереса - подсчитаем коэффициент сохранности лексики английского языка в предположении, что английский язык существует 1600 лет, и за это время в нем сохранилась √0,59=0,768 доля списка. Данному соотношению отвечает сохранность лексики за 1000 лет 0,848. Что удивительно (совершенно не удивительно) это значение, как и у коллег Сводеша, ниже принимаемого нами значения 0,869. Да, а сколько намерили в 1950-х годах классики глоттохронологии именно для английского языка? Измерение было произведено М. Сводешем на основании сравнения древнеанглийского языка 950 года с современным языком, вышло 0,85. Снаряд попал 2 раза в одну воронку, что нельзя объяснить случайностью.

Давайте подойдем к вопросу с другой стороны. Поселившиеся в Британии германские племена образовали государства, подвергались набегам скандинавов (викингов), а в 1066 году были окончательно завоеваны нормандцами в битве при Гастингсе. При коэффициенте сохранности 0,87 за 1000 лет из 200 слов списка сохраняются 174, а при коэффициенте сохранности 0,85 всего 170. Нельзя ли объяснить "потерю" 4 слов тем, что в результате контактов со скандинавами и нормандцами 4 слова (в пересчете на тысячелетие) в основном списке заменились не в процессе естественного развития языка, а за короткое время в результате контактов с носителями чужого (или чужих) языков? Или иначе: сохранилось 0,85/0,87=0,977 доля или 97,7% слов, которые должны были сохраниться, и доля заимствований в английском языке составляет (100%-97,7%)=2,3%, или около 5 слов из слов 200-словного списка.

Это и есть самое разумное объяснение не только выявившемуся расхождению на примере английского языка, но и систематическому снижению выявленных коэффициентов сохранности в 1950-е годы. Для румынского языка коэффициент сохранности оказался равным 0,77. Объяснение простое - при колонизации Дакии римлянами в народную латынь (язык завоевателей) были привнесены чужеродные заимствования, и вместо фактического (по нашим данным универсального значения 0,87) с учетом подсчитанных заимствований сохранность оказалась равной 0,77, т.е. сохраняется 0,77/0,87=0,88, или 88% тех слов, которые должны были сохраниться, тем самым в румынский язык на его начальном этапе возникновения проникло 12% заимствований. Это значение подтверждается в дальнейшем при построении дендрограммы индоевропейских языков.

Проблема заимствований

Элемент чужого языка, как и процесс вхождения этого элемента в принимающий язык, называется заимствованием. И от заимствований не свободен ни один язык, разве что язык изолированного на острове народа. Языковые контакты пришлого племени с коренным (автохтонным) населением - основной источник языковых заимствований. На то, что заимствования искажают результаты подсчета, обращал внимание еще Сводеш, исключать же их из вычислений полностью предложил советский и российский ученый-компаративист С.А. Старостин.

С.А. Старостин (1953-2005)
С.А. Старостин (1953-2005)

Согласно методу Старостина, при сравнении списка румынского языка со списком народной латыни следовало прежде выявить в списке румынского языка заимствованные слова и исключить их из подсчета, что формально подняло бы коэффициент сохранности лексики и уменьшило скорость изменения языка. Исключение заимствований связано с их идентификацией, что зачастую сопряжено с трудностью.

На основании своего метода Старостин представил свою дендрограмму индоевропейских языков, отличную от первоначальной Шлейхера и ряда последующих.

Дендрограмма индоевропейских языков Старостина
Дендрограмма индоевропейских языков Старостина

Новая глоттохронология

Но существует и иной метод построения дендрограмм, не требующий исключения заимствований и позволяющий обрабатывать наработанные лингвистами периода классической глоттохронологии данные, когда заимствования учитывались наряду с "родными" заменами в процессе естественного развития языка.

Языки развиваются не только линейно в направлении "стрелы времени" (вертикальном), но и в боковом направлении (горизонтальном). Истинные дендрограммы языковых семей и групп не одномерные, а двухмерные. Что, с одной стороны, затрудняет восприятие в сравнении с традиционными одномерными дендрограммами, а с другой - обогащает знание о языке и его месте в системе языков.

Горизонтальное направление развития языка и есть изменение словарного запаса путем заимствований. Если племя или его часть часть мигрирует на новое место, в силу контактов с местным населением возможна замена отдельных слов. в т.ч. и из базового списка, и эта замена происходит за короткое время обживания на новом месте, за несколько поколений.

Существует методика оценки этих горизонтальных изменений путем формальной обработки данных по коэффициентам совпадения. Покажем на примере всего 3 языков (русского, итальянского и румынского возможность такой оценки. Ниже лексикостатистическая матрица коэффициентов совпадений этих 3 языков, по данным американских исследователей Дайена, Крускала и Блэка 1992 года.

-8

Путем логарифмирования коэффициенты совпадений преобразуются в расстояния между языками в некоторых условных единицах. Мы назвали эти единицы сводешами, сокращенное обозначение Св. Существуют же амперы, вольты и ватты в честь ученых с соответствующими фамилиями. Ниже матрица расстояний между выбранными 3 языками.

-9

Самые близкие языки по матрице - румынский и итальянский. При расстоянии между ними 42 Св они могли разойтись 42/2= Св тому назад. Но тут возникает проблема, по-разному решавшаяся в традиционной и новой глоттохронологии. Если румынский и итальянский разошлись из единого узла дендрограммы (языка - общего предка итальянского и румынского, что-то вроде народной латыни), то исходя из чисто геометрических соображений между русским/итальянским языками и русским/румынским языками расстояния должны совпадать. Но первое расстояние равно 143 Св, а второе 152 Св. Традиционная глоттохронология не может смириться с подобным "раздраем" и предлагает считать оба расстояния одинаковыми и равными среднему расстоянию (по факту даже не среднему расстоянию, а расстоянию исходя из среднего процента совпадений, который равен 0,229; впрочем, разница между 2 методами подсчета невелика и лингвисты ею пренебрегают).

Приняв среднее расстояние равным (143+152)/2=147,5 Св и время расхождения 147,5/2=73,75 Св тому назад, получаем изображенную ниже дендрограмму.

-10

А что, если больше доверять компаративистам, составлявшим базовые списки языков и сверявшим их на предмет поиска соответствий? Рисуем новую дендрограмму. Русский и итальянский считаем разошедшимися 143/2=71,5 Св тому назад, а разницу между расстоянием до румынского и итальянского в 152-143=9 Св считаем боковым смещением румынского языка за счет заимствований. При расстоянии между румынским и итальянским в 42 Св отделение румынского от итальянского происходит (42-9)/2=16,5 Св тому назад. Строим соответствующую дендрограмму.

-11

Расстояния по данной дендрограмме полностью соответствуют исходным данным, отчего бы не принять этот метод на вооружение? Тем более что дендрограмма в части итальянского/румынского языков соответствует фактическим данным. Остается определить чему равен 1 сводеш в годах.

Новые закономерности

Выше приведен иллюстративный пример построения дендрограммы для 3 языков. Посредством метода построена дендрограмма 84 индоевропейских языков. По дендрограмме определены времена образования (разделения) 82 языков, соответствующий график ниже. Событием считается образование нового языка.

-12

На графике обращает на себя внимание горизонтальная "полочка" из 4 событий с номерами событий от 18 до 21 (выделена красным цветом). Событие № 20 - это, кстати отделение от ствола романских языков валашского (старорумынского языка), рассмотренный выше случай. Эта полочка со средним временем разделения 21,693 Св идентифицирована как события Великого переселения народов, вызванного начавшимся в начале 5-го века н.э. резким похолоданием в Северном полушарии, пик которого пришелся на период 535-536 годов, и завоеванием Европы гуннами (конец IV – начало V веков). В этот же период происходят крупные извержения вулканов 535/536, 539/540 и 547 годов, изменившие состояние атмосферы (ее прозрачность).

Если отнести это растянутое по времени событие условно на 450 год, то 21,693 Св соответствуют 1540 годам, откуда 1 Св приравнивается к 1540/21,693=71 году.

Обращаем внимание на еще одну выделенную красным цветом полочку произошедших практически одновременно 5 событий, с № от 2 до 6. При среднем времени этих событий 62,035 Св тому назад, что исходя из определенного выше соответствия 1 сводеша 71 году, соответствует времени 71*62,0=4400 лет тому назад. Эти события - отделение от ствола индоевропейских языков будущих кельтских, греческих, германских, иранских и индоарийских языков. Несмотря на разные датировки этих событий по известным нам дендрограммам, мы считаем эти события произошедшими практически одновременно и вызванными разразившейся социальной катастрофой или природным катаклизмом.

Линейность масштаба дендрограммы (соответствие 1 сводеша 71 году) в 3 точках дендрограммы (4400 лет назад, 1540 лет назад и современность) позволяют отказаться от распространенных теорий о неравной скорости языковых изменений со временем. Наши данные этого не подтверждают.

Глубина времени, которой удалось достичь по построенной дендрограмме. составляет 4900 лет назад, это время отделения от ствола индоевропейских языков предка романских языков, условно на дендрограмме считающегося итальянским. Речь, конечно же, идет о древнем языке, из которого развились все романские языки, а ближе всего оказался итальянский как наименее "загрязненный" заимствованиями.

Другая особенность графика - более чем 10-кратное возрастание скорости образования новых языков после Великого переселения народов, что подтверждается проведенными линиями линейной регрессии с указанным их наклоном.

Историю армянского языка ввиду его древности определить по данным 84 языков не удается, он простирается за пределы дендрограммы и для его точного определения необходимо привлечь связи армянского языка с языками за пределами индоевропейской семьи и с вымершими индоевропейскими языками.

Ниже дендрограмма т.н. "центральных" языков 9 языковых групп индоевропейской языковой семьи. Для удобства и с целью соблюдения единого масштаба по вертикали и горизонтали вверху современность, внизу древние времена.

Дендрограмма индоевропейских языков согласно "новой глоттохронологии"
Дендрограмма индоевропейских языков согласно "новой глоттохронологии"

В правой стороне дендрограммы шкала масштаба по оси времени.

Горизонтальные отрезки на дендрограмме пропорциональны в выбранном масштабе степени "загрязнения" отделившейся языковой группы (вернее, ее центрального языка) заимствованиями. Отделившиеся от центрального ствола группы языки в дальнейшем также воспринимают заимствования, которые суммируются с заимствованиями центрального языка, тем самым новые языки все более и более отдаляются от центрального ствола индоевропейских языков.

На дендрограмме все языковые группы отделяются от группы славянских языков, в которой центральным языком является македонский. Македонский язык - по сути искусственный язык, официально манифестированный в 1945 году. Но ядро языка, его основной список лексики, из современных языков наиболее близок к состоянию праиндоевропейского языка, которым пользовались индоевропейцы около 5000 лет назад.

Это положение языка устойчиво - если из рассмотрения исключить македонский, центральным языком, а тем самым прародителем современных индоевропейских языков, оказывается наиболее близкий к македонскому словацкий язык. При исключении и словацкого центральным становится чешский. Тем самым, особое положение на дендрограмме славянских языков позволяет решить вопрос о прародине (возможно промежуточной, по состоянию 5000 лет назад) индоевропейцев.

-14

Спасибо всем дочитавшим длинную и утомительную статью до конца. Наградой может явиться новый взгляд на устоявшиеся понятия и усвоение новых.