Найти тему
Взор

Путешествие по родному языку

Два года назад в комментариях был задан вопрос: как можно узнать то, как звучали древние слова. Оказывается поиском ответа на этот вопрос занимаются не только лингвисты, но и физики-математики, применившие свои методы. Об одном из методов будет сегодня идти речь.

https://phys.org/news/2016-07-...

Спектрограмма, показывающая форму звука слова. Иллюстрация: Джона Астона

Звуки языков, которые умерли тысячи лет назад, были снова оживлены благодаря технологии, которая по-новому изпользует статистику .

Неважно, на каком языке вы говорите - на английском или урду, валонском или вазири (пушту), португальском или персидском, собственные корни языка такие же. Прото-Индоевропейский (ПИЕ) является родным языком, который разделяют несколько сотен современных языков, а также многие из ныне вымерших и на которых говорили люди, жившие примерно от 6000 до 3500 лет до н. э. в степи к северу от Каспийского моря.

Они не оставили письменных текстов, и хотя исторические лингвисты, начиная с 19-го века, кропотливо выстраивали древний язык из дочерних языков, вопрос о том, как он на самом деле звучал, предполагался оставшимся без ответа навсегда.

В настоящее время изследователи в университетах Кембриджа и Оксфорда, чтобы вернуться к семейному древу языков, которые произошли из ПИЕ, разработали метод, основанный на звуке. Они могут смоделировать, как звучали бы определенные слова, когда они произносились 8000 лет назад.

Примечательно, что в основе технологии лежит статистика формы.

"Звуки имеют форму", объясняет профессор Джон Астон, из Кембриджской статистической лаборатории. "Когда слово произносится, оно вибрирует воздух, и форму этой звуковой волны можно измерить и превратить в ряд чисел. После того, как мы получили числовой статистический ряд (ЧСР - моё сокращение - Взор) одного слова и ЧСР другого произнесённого слова, мы можем задаться вопросом, насколько они похожи и что потребуется, чтобы перейти от одного слова к другому.

Слово, сказанное на определённом языке, будет иметь иную форму, чем у такого же слова на другом языке или на языке более раннем. Исследователи могут переходить от одной формы к другой через ряд небольших изменений в ЧСР. "Это больше, чем процесс усреднения, это континуум от одного звука к другому", - добавляет Астон, которого финансирует Совет по инженерным и физическим наукам (EPSRC). "На каждом этапе мы можем превратить форму обратно в звук, чтобы услышать, как изменилось слово.

Вместо того, чтобы реконструировать письменные формы древних слов, исследователи триангулируют назад от современных и архивных аудиозаписей, чтобы регенерировать звуковые слышимые формы из более ранних точек эволюционного дерева языка. Изпользуя относительно новую область математики, основанную на форме, изследователи берут звуковую волну и визуализируют ее как спектрограмму - в основном волнистую трехмерную поверхность, которая представляет форму этого звука, а затем изменяют спектрограмму вдоль траектории, обозначенной известными звуками.

Тогда как Aston возглавляет команду статистиков "Shape-shifters" в Кембридже, акустико-фонетическую и лингвистическую экспертизу предоставляет Группа профессора Джона Коулмана в Оксфорде.

Для своего изследования учёные взяли в качестве объекта слова, обозначающие числа, поскольку они имеют одинаковое значение в любом языке. Самый длинный путь развития, смоделированный до сих пор, уходит в прошлое на 8000 лет от английского языка до его прародителя ПИЕ oinos, а также для других цифр.

Исследователи работают над словами, обозначающими числа, поскольку они имеют одинаковое значение в любом языке. Самый длинный путь развития, смоделированный до сих пор, уходит назад на 8000 лет от [современного] английского one (один) до его прародителя oinos, а также для других цифр. Они также "перешли" от пирога penkwe к современному греческому pente (пенте), современному Валлийскому pimp (пимп) и к современной английской пятерке (five) , а также имитируют переход от современного английского к англосаксонскому (или наоборот), и от современных романских языков обратно к латыни.

«Мы явно сосредоточились на воспроизведении звуковых изменений и этимологий, о которых свидетельствуют уже установленные анализы, вместо того, чтобы пытаться их отменить», - говорит Коулман (Coleman), чьи изследования финансировались Советом по изследованиям в области искусства и гуманитарных наук.

Они обнаружили слова, которые, производят впечатление правильно "выпавших" из континуума. "Это приятно, не потому, что это опровергает общепринятый здравый смысл, а потому, что это поощряет нас, что мы получаем что-то правильное, по крайней мере, для какого-то времени. И на этом пути было также несколько сюрпризов!" Метод иногда следует путями, которые не кажутся этимологически правильными, демонстрируя, что метод является научно проверяемым, и указывая на области, в которых необходимы уточнения.

Спектрограммы, показывающие, как форма звука слова  на одном языке может быть превращена в звук того же слова на другом  языке. Иллюстрация: Джон Астон
Спектрограммы, показывающие, как форма звука слова на одном языке может быть превращена в звук того же слова на другом языке. Иллюстрация: Джон Астон

Примечательно, что, поскольку ЧСР описывает звук индивидуального произношения человека, произносящего слово, исследователи могут сохранять расстояние между символами и доставку (путь?) одинаковыми. Они могут эффективно превратить слово, произнесённое кем-то на одном языке, в то, как это звучит, если бы его свободно произносили на другом.

Они также могут экстраполировать в будущее, хотя и с оговорками, как описывает Коулман: "если вы будете просто линейно экстраполировать, вы достигнете точки, в которой изменение звука достигнет предела того, что является разумным для звукопроизношения человека (то есть то, что позволяет речевой аппарат человека). Это происходило в некоторых языках в прошлом с определёнными гласными звуками. Но если вы спросите меня, как будет звучать английский через 300 лет, моё представление заключается в том, что он вряд ли будет отличаться от сегодняшнего дня!

Для команды, волнующая часть изследования включает в себя извлечение некоторые драгоценностей из архивных записей различных языков, которые превратились в мёртвые, в том числе слова старого прусского языка, на котором люди говорили в последний раз в начале 1700-х годов, но "заимствованные" в нижнепрусский и обнаруженые в немецком аудио архиве.

Новый метод учёных имеет приложения в автоматическом переводе и озвучивании фильмов, а также в медицинской визуализации, но основная цель состоит в том, чтобы технология изпользовалась наряду с традиционными методами, применяемыми в исторической лингвистике, чтобы понять процесс изменения языка в течение тысяч лет.

"С моей точки зрения, удивительно, что мы можем превратить захватывающую, но очень абстрактную статистическую теорию в нечто, что действительно помогает объяснить корни современного языка", - говорит Астон.

"Теперь, когда мы разработали многие из необходимых технических методов для реализации экстраординарной цели - услышать древние звуки ещё раз, - добавляет Коулман, - эти начальные успехи являют широкий спектр новых вопросов, среди которых одним из центральных  является то, насколько далеко назад во времени мы можем действительно пройти?

Тут можно прослушать восстановленные слова. Например,

Семь на разных языках прослушивается при плавном переходе от одного крайнего языка до другого. Слышно и цетум, и сетум, и сем, и семь, и севен