Ыра кун (добрый день), дорогие друзья! Рад приветствовать на своем канале.
Сегодня мы обсудим интересную новость, которая недавно стала достоянием общественности. Речь идет о новой нейронной сети, которая помогает в расшифровке давно вымерших языков. Это поистине прорыв в лингвистике. Ведь подумаете, какие перспективы ждут нас, если результаты окажутся точными? Мы сможем услышать и воспроизвести иберский, шумерский, вымершие языки Северной Америки, этрусский и многие другие! Перспектива поражает. Но обо всем по порядку.
Итак, ученые сконструировали нейронную сеть с машинным обучением, которая, по их мнению, должна восстанавливать тексты мертвых и исчезнувших языков.
На сегодняшний день в мире более 1000 мертвых языков. Восстановить каждый из них, владея лишь тысячным словарным запасом, невозможно. Некоторые сведения удается почерпнуть из археологических раскопок. Однако как быть, если народ не оставил после себя никаких источников цивилизации? Гибель языка не только лингвистическая, но и этнологическая, и даже социальная катастрофа. Ведь мы никогда не сможем узнать культуру и быт того народа, не сможем восстановить историю его жизни. Это то же самое, как потерять часть конструктора при сборке макета, только в масштабе планеты!
К тому же далеко не все языки имели развитую письменность, некоторые вообще использовали лишь устную традицию. Поэтому ранние программы, работающие на основе машинного обучения не помогали восстановить даже самые простые языковые формы вымерших языков. Проблема еще и в том, что языки очень сильно отличаются друг от друга, и то, что хорошо подходит для восстановления одного, совершенно не подходит для другого.
Однако тут мы подходим к самому интересному: ученные из Массачусетского технологического института с кафедры искусственного интеллекта пошли дальше. Они разработали программу, которая бы осуществляла автоматический перевод примерного текста языка (из сохранившихся слов), без учета связей с другими языками.
Для примера были взяты иберский и шумерский. Первый проверяли на связи с баскским (точнее, на их отсутствие), а второй на связь с кавказскими. Эксперимент уже дал первые результаты, которые показывают отсутствие таковых связей между этими языками. Однако любая теория нуждается в повторной проверке. Так что будем ждать новых результатов.
На данный момент ученые пытаются улучшить программу, чтобы она использовала минимальный запас слов для расшифровки очень редких языков. Для этого они применяют методы исторической лингвистики, которые базируются на постулате, что языки изменяются только в строгом порядке.
Нейросеть изучает звуки конкретного языка и помечает их как векторы многомерного пространства, а различия между произношением должны определяться расстоянием между такими векторами. Подобная система помогает отслеживать языковые изменения и искать связь между ними, а также записывать все это в виде формул. Такая формула в дальнейшем будет упорядочивать слова изучаемого языка и искать параллели в родственных языках.
Звучит сложно, но на самом деле это действительно выдающееся открытие. Если эксперименты будут удачными, то мы не только сможем восстановить словарный запас того или иного языка, но и обнаружить родственные связи с ныне живущими!
А что вы думаете по этому поводу? Пишите свои комментарии, ставьте лайки, подписывайтесь! Всего доброго!