Т. А. Горностай

ГРАММАТИЧЕСКИЕ ТРАНСФОРМАЦИИ ПРИ ЛАТЫШСКО-РУССКОМ МАШИННОМ ПЕРЕВОДЕ

Работа представлена кафедрой прикладной лингвистики РГПУ им. А. И. Герцена.

Научный руководитель - доктор филологических наук, профессор Л. Н. Беляева

В статье рассматриваются грамматические трансформации при латышско-русском машинном переводе на примере морфологических и синтаксических преобразований при переводе имени существительного.

Ключевые слова: машинный перевод, трансфер, грамматические трансформации.

T. Gornostay

GRAMMATICAL TRANSFORMATIONS IN LATVIAN-RUSSIAN MACHINE TRANSLATION

The article studies grammatical transformations in Latvian-Russian machine translation by the example of morphological and syntactical transformations in noun translation.

Key words: machine translation, transfer, grammatical transformations.

Перевод текста с одного естественного языка на другой - сложный процесс. Перевод с латышского языка на русский язык не явля-

ется исключением и предполагает необходимость постановки и решения разнообразных задач. Эти задачи можно разделить на экст-

ралингвистические, связанные с социальными, культурными, этническими, историческими, географическими аспектами языка, и собственно лингвистические - лексические и грамматические особенности сопоставляемых языков, которые приводят к необходимости преобразований в процессе перевода [1; 2; 3].

В статье рассматриваются грамматические преобразования (трансформации), необходимые при машинном переводе с латышского на русский язык. Работа конкретной системы машинного перевода и то, как в ней решаются конкретные проблемы, определяются принятой в системе стратегией перевода. В разработанной системе латышско-русского машинного перевода используется стратегия трансфера. В самом общем виде, алгоритм перевода в системе машинного перевода с трансфером представляет собой трехуровневый процесс: анализ входной структуры исходного языка, преобразование этой структуры в эквивалентную структуру переводного языка и синтез выходной структуры переводного языка.

При более детальном рассмотрении перевод предстает как многоуровневый процесс, при котором происходит последовательное преобразование текста. Так, в системах машинного перевода с латышским языком [5; 7] на уровне трансфера можно выделить три этапа:

1) грамматическое преобразование входной структуры латышского языка в выходную структуру русского языка (морфологические и синтаксические трансформации);

2) лексическое преобразование входной структуры (собственно перевод с извлечением переводных эквивалентов из двуязычного словаря);

3) морфологическое оформление выходной структуры русского языка (морфологические трансформации).

Грамматические (морфологические и синтаксические) трансформации проводятся с использованием правил, которые применяются на первом и третьем этапах трансфера.

Для разработки подобных правил необходим сопоставительный анализ грамматических особенностей латышского языка и их перевода на русский язык. Ввиду отсутствия представительного латышско-русского параллельного корпуса, сопоставительный анализ грамматических свойств латышского и русского языков проводился на материале практических грамматик обоих языков [4; 6]. В ходе такого анализа были составлены сопоставительные таблицы грамматических категорий для каждой части речи латышского и русского языков и основных структур, требующих грамматических трансформаций. На основе данных таблиц были разработаны правила для следующих грамматических трансформаций: замена, добавление или удаление морфологических характеристик; изменение порядка слов; скрытие вершины дерева; добавление новой вершины дерева; перенос грамматической информации с одной вершины дерева на другую. Рассмотрим примеры грамматических трансформаций при машинном переводе на материале сопоставительного анализа систем латышского и русского существительных.

В обоих языках совпадает набор грамматических категорий существительного, включающий категории рода, числа и падежа. Наибольшее количество различий в системах латышского и русского существительных наблюдается в наборе падежей каждого из языков, комплексе грамматических значений конкретного падежа и способе их выражения. Так, беспредложная форма локатива в пространственном значении в латышском языке не соответствует форме предложного падежа в русском языке, которая всегда употребляется с предлогом, например, skolä - в школе. В данном случае необходима синтаксическая трансформация добавления новой вершины дерева - предлога к русскому существительному в предложном падеже. На рис. 1 приведен пример такого правила, в котором функция insertjeftmost добавляет новую вершину NewNode (предлог в) и назначает ей характеристику части речи PREP (предлог).

Грамматические трансформации при латышско-русском машинном переводе

Rule(N] // locative_2

Target.Case == locative;

Target.KindOf== Mlocative_2";

i ns e rtj e ftmo st [N e wN о d e.Ta rget.p com p);

NewNode.TargetSpelling = "в";

NewNode.POS = PREP;

Рис. 1. Пример правила синтаксической

трансформации добавления предлога к русскому существительному в форме предложного падежа

Более того, в русском языке ограниченная группа слов мужского рода I склонения образует вторую форму предложного падежа в единственном числе в пространственном значении в сочетании с предлогами в и на с флексией -|у|, например, в лесу. Соответственно для данной группы слов необходимо синтезировать именно вторую форму предложного падежа русского переводного эквивалента, которая будет соответствовать локативу в латышском языке. Для этого необходимо передать системе машинного перевода знания о том, какие существительные в русском языке могут иметь вторую форму предложного падежа. Список таких существительных русского языка с дополнительной характеристикой locative_2 хранится в системе латышско-русского машинного перевода в отдельном словарном модуле. При применении правила синтаксической трансформации добавления предлога к конкретному русскому существительному в предложном падеже, функция KindOf проверяет принадлежность данного существительного к этому списку. В случае совпадения будет синтезирована вторая форма предложного падежа для русского переводного эквивалента.

В латышском языке также есть отдельная падежная форма - вокатив (звательный падеж), которая соответствует обращению в русском языке, не имеющему морфологиче-

ского выражения, и переводится на русский язык формой именительного падежа, например, БкоШа]! - Учитель! Для корректного синтеза русского существительного необходима трансформация замены морфологической характеристики звательного падежа латышского существительного на значение именительного падежа русского переводного эквивалента.

При латышско-русском машинном переводе именных групп нередко приходится прибегать к изменению порядка слов в выходной структуре русской именной группы. Такая синтаксическая трансформация необходима, например, при переводе латышских именных генитивных конструкций (аёпошь паЫБ ¿ешЦуБ), которые представляют особую сложность для машинного перевода на русский язык. Дело в том, что в латышском языке в группе существительного все падежные формы следуют за существительным в генитиве, т. е. в латышской двухком-понентной именной генитивной конструкции определяемое существительное в родительном падеже находится в препозиции к определяющему существительному в именительном падеже. Рассмотрим подобную трансформацию на примере латышской двухкомпонентной генитивной конструкции, состоящей из двух существительных, одно из которых употреблено в форме генитива (родительного падежа) агЩп зкаНз (Ы1ёеп N). Для успешного синтеза русской именной группы необходима синтаксическая трансформация изменения порядка

слов в исходной структуре латышского язы-

1 2 2 1 ка N ёеп N -> N N ёеп. Для этого применяется правило, пример которого приведен на рис. 2. При этом с помощью функции move_to_right латышское существительное в родительном падеже ¡а$Ш]п будет перемещено в положение постпозиции по отношению к ядру латышской именной генитивной конструкции skaits, соответственно в момент формирования русского перевода порядок слов будет правильным.

Тгаг^егКи1е(Н<-тос1-1Ч] //^епИ

Рис. 2. Пример правила синтаксической трансформации изменения порядка слов в латышской именной генитивной конструкции

В результате сопоставительного анализа грамматик латышского и русского языков, а также на основе выделения структур, требующих преобразований, разработаны правила грамматических трансформаций. Эти правила, применяемые при латышско-русском

машинном переводе с трансфером, примеры которых рассмотрены в статье на материале существительного, позволяют внести изменения в грамматическую информацию отдельной лексической единицы или в структуру конкретной синтаксической конструкции для успешного их синтеза на последнем этапе машинного перевода. Таким образом, достигается основная цель работы системы машинного перевода и обеспечивается ее эффективность: система позволяет получить перевод текста, сохраняя в процессе преобразования его общее содержание и передавая его на язык перевода так, что его может воспринять пользователь, обладающий знаниями предметной области или темы сообщения.

СПИСОК ЛИТЕРАТУРЫ

1. Беляева Л. Н. Теория и практика перевода: учеб. пособие. СПб.: ООО «Книжный Дом», 2007. 212 с.

2. Беляева Л. Н. Лингвистические автоматы в современных гуманитарных технологиях: учеб. пособие. СПб.: ООО «Книжный Дом», 2007. 192 с.

3. Пиотровский Р. Г. Новые горизонты машинного перевода // Научно-техническая информация. Сер. 2. Информационные процессы и системы. М., 2002. № 1. С. 17-29.

4. Русская грамматика: в 2 т. 1980. Т. 1: Фонетика. Фонология. Ударение. Интонация. Словообразование. Морфология. М.: Наука. 783 с.

5. Deksne D., Skadina I, Skadins R., Vasiljevs A. Foreign language reading tool - first step towards English-Latvian commercial machine translation system // Proceeding of the Second Baltic Conference on Human Language Technologies. Tallinn: Tallinna Raamatutrukikoda, 2005. P. 113-118.

6. Paegle D. Latviesu literaras valodas morfologija: 1. d. Riga: Zinatne, 2003.

7. Skadins R., Skadina I., Deksne D., Gornostay T. English/Russian-Latvian Machine Translation System // Proceeding of the Third Baltic Conference on Human Language Technologies. Vilnius: Institute of the Lithuanian Language. 2003. P. 287-295.

REFERENCES

1. Belyayeva L. N. Teoriya i praktika perevoda: ucheb. posobiye. SPb.: OOO «Knizhny Dom», 2007. 212 s.

2. Belyayeva L. N. Lingvisticheskiye avtomaty v sovremennykh gumanitarnykh tekhnologiyakh: ucheb. posobiye. SPb.: OOO «Knizhny Dom», 2007. 192 s.

3. Piotrovsky R. G. Novye gorizonty mashinnogo perevoda // Nauchno-tekhnicheskaya informat-siya. Ser. 2. Informatsionnye protsessy i sistemy. M., 2002. N 1. S. 17-29.

4. Russkaya grammatika: v 2 t. 1980. T. 1: Fonetika. Fonologiya. Udareniye. Intonatsiya. Slovoo-brazovaniye. Morfologiya. M.: Nauka. 783 s.

5. Deksne D., Skadina I., Skadins R., Vasiljevs A. Foreign language reading tool - first step towards English-Latvian commercial machine translation system // Proceeding of the Second Baltic Conference on Human Language Technologies. Tallinn: Tallinna Raamatutrukikoda, 2005. P. 113-118.

6. Paegle D. Latviesu literaras valodas morfologija: 1. d. Riga: Zinatne, 2003.

7. Skadins R., Skadina I., Deksne D., Gornostay T. English/Russian-Latvian Machine Translation System // Proceeding of the Third Baltic Conference on Human Language Technologies. Vilnius: Institute of the Lithuanian Language. 2003. P. 287-295.