Добавить в корзинуПозвонить
Найти в Дзене

Воквайский треугольник: Тайна раскрыта

Треугольник Вокуа - это классическая иерархическая модель для визуализации различных подходов к машинному переводу. Прежде чем мы погрузимся в треугольник Вокуа, давайте рассмотрим, что такое машинный перевод. Что такое машинный перевод? Машинный перевод - это процесс использования компьютерных программ для перевода текста или речи на одном естественном языке на другой. Определение может показаться простым, но сам процесс чрезвычайно сложен. Языки различаются по многим параметрам: грамматически, синтаксически (структура предложения), семантически (значения) и т. д. Такие различия называются переводческими расхождениями. Например, рассмотрим цитату из корейской драмы "О, моя Венера", Корейский: mid-eumyeon hal su isso, hal su issdago mid nikka Английский: if [you] believe [it] [you] can do [it], because [you] believe that [you] can Как мы видим, с точки зрения структуры, корейский язык следует соглашению SOV (субъект-объект-глагол), в то время как английский - SVO (субъект-глагол-объект
Оглавление

Треугольник Вокуа - это классическая иерархическая модель для визуализации различных подходов к машинному переводу. Прежде чем мы погрузимся в треугольник Вокуа, давайте рассмотрим, что такое машинный перевод.

Что такое машинный перевод?

Машинный перевод - это процесс использования компьютерных программ для перевода текста или речи на одном естественном языке на другой. Определение может показаться простым, но сам процесс чрезвычайно сложен. Языки различаются по многим параметрам: грамматически, синтаксически (структура предложения), семантически (значения) и т. д. Такие различия называются переводческими расхождениями.

Например, рассмотрим цитату из корейской драмы "О, моя Венера",
Корейский: mid-eumyeon hal su isso, hal su issdago mid nikka
Английский: if [you] believe [it] [you] can do [it], because [you] believe that [you] can

Как мы видим, с точки зрения структуры, корейский язык следует соглашению SOV (субъект-объект-глагол), в то время как английский - SVO (субъект-глагол-объект). В таких языках, как корейский и японский, местоимения не используются в явном виде. Такие языки, в которых местоимения отсутствуют, называются просодическими. Подобные различия затрудняют машинный перевод, поскольку такие пропуски необходимо идентифицировать и правильно интерпретировать. В этих двух языках есть и ряд других различий. Переводчик должен анализировать все элементы предложения и знать, как каждое слово может влиять на другое.

Вокуанский треугольник

В 1968 году Бернар Вокуа рассмотрел подходы к машинному переводу того времени и представил их в виде треугольника. Эта схема известна как треугольник Вокуа. Треугольник Вокуа визуализирует и описывает классические подходы к машинному переводу, показывая эволюцию этих подходов.

К этим подходам относятся, в основном, прямой подход, подход на основе перевода и подход на основе интерлингва. Глубина анализа, необходимая для каждого подхода, увеличивается по мере перехода от прямого к межъязыковому, в то время как объем необходимых знаний о переводе уменьшается по мере перехода от прямого к межъязыковому подходу.

Прямой перевод

Подход прямого перевода использует двуязычный словарь для перевода предложений слово за словом, где каждое исходное слово сопоставляется с некоторым целевым словом. В процессе перевода не используются никакие промежуточные структуры, кроме морфологического анализа (задача анализа структуры и частей слов) или лемматизации (задача преобразования слова в его основную словарную форму, например, перевести в переводчик).

Исходный язык переводится слово за словом с помощью двуязычного словаря путем сопоставления каждого слова со словом языка перевода после анализа структуры и частей предложения. Затем в полученном предложении на языке перевода выполняются некоторые простые процессы переупорядочивания, чтобы сделать его структуру правильной.

Перевод на основе перевода

При переводе на основе переноса сначала выполняется синтаксический разбор предложения на исходном языке для определения его структуры, применяются правила переноса полученной структуры в структуру разбора на языке перевода, основанные на знании различий между языками, а затем на основе этой преобразованной структуры генерируется предложение на языке перевода.

В зависимости от исходного и переводного языков, подходы к переводу могут различаться. Для схожих языков, таких как французский и итальянский (почти 90% лексического сходства), необходим только синтаксический перенос, когда разобранная структура исходного языка переносится в структуру разбора целевого языка на основе синтаксического упорядочивания.

Для сложных процессов перевода, таких как перевод с корейского на английский, помимо синтаксического переноса, необходим также семантический перенос, когда исходная структура должна быть перенесена в соответствии с их значением и семантической ролью в целевом предложении.

Межъязыковой перевод

При интерлингвальном подходе сначала анализируется предложение на исходном языке, представляется в виде интерлингвы, а затем на основе этой интерлингвы генерируется предложение на целевом языке. Интерлингва - это независимое от языка представление, которое может быть основано на любой схеме представления.

Доступность большого количества данных и более быстрые системы обработки изменили мир машинного перевода, превратив его из классических подходов и эпохи Вокуа в более быстрые и эффективные результаты.