Добавить в корзинуПозвонить
Найти в Дзене
Наука на пальцах

Библия как основа высоких технологий

Из почти 7000 языков, существующих в мире, более 90% людей пользуются примерно сотней из них. Кроме того, около трети языков в скором времени могут исчезнуть. В настоящее время компьютерные системы перевода работают именно с сотней языков из-за того, что им нужен огромный массив текстов. Сотрудники Мюнхенского университета применили автоматический метод анализа редких языков. Была построена база текстов на основе переводов Библии на более, чем 1100 языков. Исследователи составили диаграмму родственных взаимоотношений между языками с использованием лингвистических меток времени. Эти работы приближают появление мгновенного компьютерного перевода на множество языков, превосходящего по качеству перевод, сделанный человеком. В то же время, намного медленнее появляются переводчиков стиля, которые сохраняют текст на одном языке, но преображают стиль, то есть могут преобразовывать написанные произведения в разные стили для разных аудиторий. Усилия по развитию переводчиков тормозятся

Из почти 7000 языков, существующих в мире, более 90% людей пользуются примерно сотней из них. Кроме того, около трети языков в скором времени могут исчезнуть.

В настоящее время компьютерные системы перевода работают именно с сотней языков из-за того, что им нужен огромный массив текстов. Сотрудники Мюнхенского университета применили автоматический метод анализа редких языков. Была построена база текстов на основе переводов Библии на более, чем 1100 языков. Исследователи составили диаграмму родственных взаимоотношений между языками с использованием лингвистических меток времени. Эти работы приближают появление мгновенного компьютерного перевода на множество языков, превосходящего по качеству перевод, сделанный человеком. В то же время, намного медленнее появляются переводчиков стиля, которые сохраняют текст на одном языке, но преображают стиль, то есть могут преобразовывать написанные произведения в разные стили для разных аудиторий. Усилия по развитию переводчиков тормозятся из-за отсутствия необходимого количества данных. И здесь разработчики из Дартмутского колледжа обратились к Библии. В журнале Royal Society Open Science отмечено, что это не просто параллельный набор данных, для перевода стиля, но первый, случай использования для этого Библии. Тексты, использовавшиеся ранее, от Шекспира до Википедии, либо намного меньше по базе данных, либо не подходили для обучения перевода стиля. «Библия – это «божественный» массив данных для этой задачи», заявил профессор информатики Даниэль Рокмор. Исследователи использовали 34 стилистически различных библейских варианта. В итоге могут быть созданы системы, которые переводят стиль любого письменного текста для самых разных аудиторий.