Новый алгоритм искусственного интеллекта взламывает нерасшифрованные языки
Ученые создали новый алгоритм для поиска сходств в древних языках, что поможет в раскрытии тайн всех нерасшифрованных языков.
Согласно новому исследованию Массачусетского технологического института, «на большинстве языков, которые когда-либо существовали, больше не говорят». Изучение утерянных и «нерасшифрованных языков» становится исключительно сложной задачей, поскольку существует очень мало древних записей, то ограничивает понимание грамматики, лексики или синтаксиси древних языков.
Отслеживание эволюции нерасшифрованных языков
Команда исследователей из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) создала новую компьютерную систему, которая способна «автоматически расшифровывать потерянные языки», не требуя глубоких знаний об их устройстве. Кроме того, эта новая система была протестирована на способность автоматически определять любые отношения между языковыми группами, к примеру, в ходе этих тестов было установлено, что иберийский язык Испании не имеет отношения к баскскому.
Одна из пяти мемориальных досок Monumento a los Fueros (Пасео де Сарасате, Памплона), была написана в 1905 году на баскском языке и адаптирована к северо-восточному иберийскому письму.
Профессор Массачусетского технологического института Регина Барзилай в своей новой статье объясняет, что система «опирается на несколько принципов, основанных на выводах исторической лингвистики», поскольку языки развиваются предсказуемыми способами. Д-р Барзилай объясняет, что языки редко добавляют или опускают целые звуки и рослеживаются определенные звуковые сходства.
Перевод звуков в безмолвном киберпространстве
Собрав все известные лингвистические шаблоны группа ученых разработала новый «алгоритм дешифрования», который предназначен для обработки и интерпретации того, что исследователи называют «обширным пространством возможных преобразований при недостаточном управляющем сигнале на входе». Новый алгоритм самообучается, встраивая языковые конструкции «в многомерное пространство».
Это означает, что новая система или алгоритм позволяет исследователям вычленять языковые шаблоны и использовать их для формирования новых конструкций на утерянном языке, далее по сходству со связанными языками выявляет общие черты и предлагает возможные варианты.
Пример линейного письма на (пока еще) нерасшифрованном языке.
Плавая в концептуальном киберпространстве, новый алгоритм действует как фонетическое зеркало, поскольку он отражает любые звуковые структуры, которые он распознает как похожие на другие. Система также может определять близость между любыми двумя заданными языками и может точно определять «языковые семьи». Вот почему команда применила новый тест (алгоритм) на иберийском и баскском языках, «а также на менее вероятных кандидатах из романских, германских, тюркских и уральских семей».
Исследователи Массачусетского технологического института надеются, что соединение древних текстов со связанными словами на известных языках, процесс, известный как «расшифровка на основе родственных слов», является лишь первым шагом в создании сверхсовременной системы, которая в конечном итоге сможет идентифицировать семантическое значение слов, даже если неизвестно, как именно эти древние слова были изначально произнесены.