microbik.ru
1 2


ПРОБЛЕМЫ МАШИННОГО ПЕРЕВОДА

Москва 2003
СОДЕРЖАНИЕ
Введение ……………………………………………………………………….3

1. Машинный перевод как лингвистическая задача
    1. Возникновение и развитие машинного перевода …………………4

    2. Возникновение проблем машинного перевода……………………7


2. Общелингвистические вопросы машинного перевода

2.1. Проблема переводимости……………………………………………11

2.2. Проблема грамматических различий в языках……………………..12

2.3. Решение проблем механизации перевода…………………………..16

Заключение …………………………………………………………………..24

Список литературы…………………………………………………………..25

Приложение…………………………………………………………………..26

ВВЕДЕНИЕ



Изменение места перевода в современном мире, а также внутренние потребности самой лингвистики привели к тому, что теоретики начали все более интересоваться конкретными проблемами языковых соответствий и другими чисто лингвистическими аспектами перевода.

Машинный перевод – это шаг к объективному эксперименту в теории перевода и вообще в языкознании.

Машинный перевод предполагает те или иные гипотезы о процессе перевода, которые в дальнейшем проверяются путем моделирования процесса перевода в машине. При такой постановке вопроса машинный перевод играет не только практическую роль, он открывает пути для объективного изучения языковых процессов, имеющих место в переводе. Это в свою очередь должно обогатить и практическую реализацию машинного перевода, а также помочь построению других машин, связанных с языком: машин для перевода устной речи в письменную, информационных машин и т.п.

Актуальность темы данной работы заключается в том, что до настоящего времени еще полностью не решены проблемы машинного перевода, поставленные в 50-е годы XX столетия.

Изучение и последующее решение проблем машинного перевода представляет собой важнейшее направление в современной теории перевода. В эпоху индустриализации общества, в условиях все возрастающего потока информации и постоянно развивающихся компьютерных технологий настало время вплотную подойти к решению этих проблем, начало которым было положено с момента возникновения самого машинного перевода.

Актуальность темы заключается и в том, что решение этих проблем имеет решающее значение для прогресса человечества, и поэтому неудивительно, что как лингвисты, так и разработчики компьютерных переводчиков все большее внимания уделяют этому вопросу.
1. МАШИННЫЙ ПЕРЕВОД КАК ЛИНГВИСТИЧЕСКАЯ ЗАДАЧА

1.1. Возникновение и развитие машинного перевода



Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического прототипа электронных цифровых вычислительных машин, появившихся через 100 лет1.

Фактически история машинного перевода начинается с "Джорджтаунского эксперимента" (США). В январе 1954 г. состоялась первая публичная демонстрация машинного перевода с русского языка на английский, осуществленного на машине ИБМ-701. Сообщение об этом событии было опубликовано в журнале Computers and Automation, 1954, № 2. Реферат этого сообщения, сделанный Д.Ю. Пановым, появился в РЖ ВИНИТИ "Математика", 1954, № 10: "Перевод с одного языка на другой при помощи машины: отчет о первом успешном испытании"2.

Это сообщение явилось толчком для начала работ по машинному переводу в СССР. Первый опыт перевода с английского языка на русский с помощью машины БЭСМ был получен уже к концу 1955 г. Программы для БЭСМ составляли Н. П. Трифонов и Л. Н. Королев, кандидатская диссертация которого была посвящена методам построения словарей для машинного перевода.

Впрочем, основа для успехов отечественных ученых закладывалась намного раньше. В 1920-х годах в России велись интенсивные исследования по семиотике текста3, в то время как широкомасштабное изучение семиотики во всем мире относится только к началу 1960-х годов4.

Стремительный прогресс семиотики стал основой для сближения лингвистики и математики на почве популярного в 1950-60-е годы математического структурализма. Идеи семиотики объединяли крупнейших ученых, среди которых математик В.Успенский и лингвист В.Иванов. Успехи формального подхода к описанию языка наглядно продемонстрировали возможность превращения чисто гуманитарной науки в логически строгую дисциплину.

Работы по кибернетике и, в частности, по структурной лингвистике, развернутые в конце 50-х годов под руководством академика А.Берга и члена-корреспондента АН СССР А.Ляпунова, вывели отечественную науку на передовые позиции. Уже в начале 1956 года в Институте прикладной математики (ИПМ) им. М.В. Келдыша заработала первая отечественная система машинного перевода с французского на русский язык. Система ФР-I давала перевод более высокого качества, чем у американцев. Математики рассматривали алгоритмы машинного перевода как частные случаи изучаемых в кибернетике алгоритмов перекодирования.

Огромное значение имело выработанное А. Ляпуновым и О. Кулагиной теоретико-множественное представление грамматических категорий языка. Эти результаты были получены независимо от работ Ноама Хомского (Noam Chomsky), считающегося создателем теории формальных грамматик. Большую роль сыграли работы И.Мельчука по автоматическому грамматическому анализу.

Обобщения и систематизация результатов математической лингвистики позволили создать стройную теорию формальных языков. Проблема заключалась в одном: аппарат теории формальных языков был очень хорош для искусственных языков, в частности для языков программирования, но не давал приемлемых результатов для анализа естественного языка и построения адекватной системы машинного перевода.

Искусственные алгоритмические языки в программировании специально создаются так, чтобы было удобно манипулировать формальными конструкциями, описывающими «прозрачную» семантику, которая сводится, как правило, к конкретным действиям. В естественном языке есть нечто большее - буквальная семантика, с которой и связано понимание человеком текста. Понимание это может быть не таким уж простым даже для носителя языка, и связано оно с мыслительными процессами, а не с формальными правилами описания самого языка. Поэтому для автоматического перевода надо уметь описывать смысл фразы, а не ее формальную запись.

Разработка И.Мельчуком и А.Жолковским лексических функций, создание теории «Смысл-Текст» явились колоссальным скачком в построении строгой концептуальной системы, применимой для анализа естественного языка. Суть теории Мельчука можно свести к построению формального семантического языка, на котором и будет описываться смысл текста. Это открывает огромные возможности, как для задач анализа текстовой информации, так и для задач машинного перевода. Реализацией этих возможностей занимался коллектив под руководством академика Ю.Апресяна, разрабатывающий систему машинного перевода ЭТАП. В настоящее время эти очень важные работы продолжаются в лаборатории Института проблем передачи информации РАН, возглавляемой И.Богуславским.

Компьютерная лингвистика стремительно развивалась в СССР в 1960-е годы. Однако в следующем десятилетии работы в области машинного перевода оказались под жестким государственным контролем, который способствовал прекращению или замедлению многих работ, и исследования по машинному переводу практически прекратились 5.

Первые программы машинного перевода, разработанные коллективом Ляпунова, были реализованы на машине "Стрела". Первое поколение систем машинного перевода базировалось на алгоритмах последовательного перевода "слово за словом", "фраза за фразой". Возможности таких систем определялись доступными размерами словарей, прямо зависящими от объема памяти компьютера. Перевод текста осуществлялся отдельными предложениями, смысловые связи между ними никак не учитывались - системы прямого перевода6.

На смену им со временем пришли системы последующих поколений, в которых перевод от языка к языку осуществлялся на уровне синтаксических структур. В алгоритмах перевода использовался набор операций, позволяющий путем анализа переводимого предложения построить его синтаксическую структуру по правилам грамматики языка входного предложения, а затем преобразовать ее в синтаксическую структуру выходного предложения и синтезировать выходное предложение, подставляя нужные слова из словаря. Такие системы называются Т-системами (Т - от английского слова "transfer - преобразование").

Наиболее совершенным считается подход к построению систем машинного перевода на основе получения некоторого, независимого от языков, смыслового представления входного предложения путем его семантического анализа. Затем производится синтез выходного предложения по полученному смысловому представлению. Такие системы называют И -системами (И - от слова "интерлингва"). Считается, что следующие поколения систем машинного перевода будут относиться к классу И-систем7.

Пока неизвестно, какие возможности даст человечеству надвигающаяся новая компьютерная революция. Однако можно надеяться, что компьютерная лингвистика перейдет на совершенно новую технологическую базу, основа которой закладывается в наше время 8.
1.2. Возникновение проблем машинного перевода
Проблематику автоматического машинного перевода в последние годы все чаще относят к особой научной дисциплине под названием «компьютерная лингвистика», основная проблема которой состоит в том, что компьютеры «не желают различать смысловые оттенки и выдавать красивые литературные переводы»9.

Еще до возникновения проблематики машинного перевода некоторые лингвисты выступили с попытками как обоснования принципов общей теории перевода, построенной на лингвистических началах, так и с частными разработками, в которых эти принципы реализуются 10.

Рассматривая проблему машинного перевода, А.А. Ляпунов говорил о переводе путем извлечения смысла переводимого текста и его представления на другом языке. Однако такая постановка проблемы перевода оказалась в то время преждевременной. Более того, она не решена в общем виде мировой информатикой и в настоящее время, несмотря на усилия, предпринимавшиеся Международной федерацией IFIP - мировым сообществом ученых в области обработки информации. Однако многие частные результаты, связанные с семантическим анализом текстов, были получены и опубликованы в трудах IFIP.

Первый опыт создания программ машинного перевода показал, что необходимо решать эти проблемы постепенно и по частям. Необходимо было решить следующие вопросы:

  • как нужно формализовать и строить алгоритмы для работы с текстами?

  • какие словари надо вводить в машину?

  • какие лингвистические закономерности следует использовать при машинном переводе?

  • каковы все эти закономерности?

Выяснилось, что традиционная лингвистика не располагает ни фактическим материалом, ни идеями и представлениями, нужными для построения систем машинного перевода, которые использовали бы смысл переводимого текста. Традиционная лингвистика не могла дать исходные представления не только в части семантики, но и в части синтаксиса. Ни для одного языка в то время не существовало перечней синтаксических конструкций, не были изучены условия их сочетаемости и взаимозаменяемости, не были разработаны правила построения крупных единиц синтаксической структуры из более мелких. В сущности ни на один вопрос, поставленный в связи с построением систем машинного перевода, традиционная лингвистика в 50-х годах не могла дать ответа.

Как было сказано выше, потребность в создании теоретических основ машинного перевода привела к формированию нового направления в лингвистике - структурной, прикладной, математической лингвистики. Формирование этого направления в СССР относится ко второй половине 50-х годов. Ведущую роль в нем сыграли математики А.А. Ляпунов, В.А. Успенский, О. С. Кулагина, лингвисты В.Ю. Розенцвейг, П.С. Кузнецов, А.А. Реформатский, И.А. Мельчук, В.В. Иванов.

Под математической лингвистикой понималось изучение языка как абстрактной знаковой системы с целью построения теоретической основы машинного перевода и создания конкретных алгоритмов перевода. В таком понимании математическая лингвистика составляла часть семиотики - общей теории знаковых систем11.

Задача аксиоматизации лингвистики была выдвинута одним из виднейших лингвистов московской школы П.С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914). Исследованию формальной теории грамматик, была посвящена диссертация О.С. Кулагиной, выполненная под руководством А. А. Ляпунова. В те же годы формальная теория грамматик развивалась в США в трудах Н. Хомского, ставших классическими для области искусственных языков, в частности языков программирования.

Двадцатилетие (1956-1976) один из основателей направления математик В. А. Успенский в своих воспоминаниях назвал "серебряным веком" структурной, прикладной и математической лингвистики в СССР. В 70-х годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г.Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В. М. Зелко в 80-х годах.

Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов. Они были реализованы на персональных компьютерах и являлись системами прямого перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты12.

2. ОБЩЕЛИНГВИСТИЧЕСКИЕ ВОПРОСЫ

МАШИННОГО ПЕРЕВОДА
2.1. Проблема переводимости
Проблема переводимости связана с тем, что действительность по-разному членится разными языками. Именно исходя из этого факта, многие лингвисты ставили под сомнение возможность перевода текстов с одного языка на другой. Наиболее ярко идея несводимости друг к другу двух картин мира, описываемых разными языками, была высказана в лингвистике В.Гумбольдтом: «Каждый язык описывает вокруг народа. Которому он принадлежит, круг, из пределов которого можно выйти только в том случае, если вступаешь в другой круг. Изучение иностранного языка можно было бы поэтому уподобить приобретению новой точки зрения в прежнем миропонимании; … только потому, что в чужой язык мы в большей или меньшей степени переносим свое собственное миропонимание и свое собственное языковое воззрение, мы не ощущаем с полной ясностью результатов этого процесса»13.

Нет основания отрицать полностью мысль о непереводимости. Нет переводчика, который в своей практической деятельности не наталкивался бы на явления, не поддающиеся переводу. Да и теоретически ясно, что существуют такие категории языка, между которыми соответствия установить нельзя, следовательно, нельзя и сохранить инвариантность смысла. Важно, однако, уточнить, какие категории языка имеются в виду, когда говорят о непереводимости.

Разработка правил машинного перевода с одного языка на другой поставила перед лингвистами ряд проблем, которые относятся как к переводу с различных языков и на различные языки, так и к принципам анализа текста на некотором данном языке.

2.2. Проблема грамматических различий в языках
Различие в типе грамматического (и именно морфологического) строя языка обуславливает некоторые различия в характере переводческих правил для данного языка. Необходимость таких различий была обнаружена уже при разработке правил перевода с французского на русский и с английского на русский, поскольку в английском языке отсутствует ряд форм, имеющихся во французском языке, вследствие чего гораздо уже представлено согласование как форма связи между членами словосочетания 14.

Лингвистической задачей машинного перевода является выработка такой системы правил, которая позволила бы, имея некоторый текст на данном языке, однозначно определить, какой текст другого языка должен быть адекватен по смыслу данному тексту. Любой язык имеет словарный состав и грамматический строй. Поэтому любой текст любого языка содержит слова, связанные между собой по нормам грамматического строя данного языка. Различные грамматические связи служат для выражения различных отношений между понятиями, выражаемыми словами. Поэтому правила перевода с одного языка на другой должны содержать, как правила перевода слов, так и правила передачи грамматических средств одного языка, выражающих некоторые отношения, грамматическими средствами другого языка, выражающими те же отношения.

Ввиду различий, существующих между языками, невозможно построить некую единую универсальную систему правил перевода с любого языка на любой, но каждая система правил, какая может быть построена, должна связывать лишь два конкретных языка, притом лишь в одном направлении. Так, например, может быть построена одна система правил для перевода с французского языка на русский, другая – с русского на французский, третья - с английского на русский и т.п. Но в то же время могут быть определены и некоторые общие принципы, т.е. некоторые общие правила для построения различных конкретных систем правил, точно так же, как при всем различии грамматической структуры разных конкретных языков земного шара существуют некоторые общие принципы изучения грамматической структуры языка, на которые, в частности, опирается и классификация языков по их грамматическому типу.

При наличии большого количества языков, которые должны быть связаны переводческими отношениями, встает вопрос, как более целесообразно строить правила перевода для двусторонней связи каждого данного языка с другим в пределах определенной группы. Возможно, что целесообразно сначала переводить на один какой-нибудь язык, через посредство которого осуществляется перевод на другие языки. Операция перевода в этом случае, по-видимому, несколько замедляется, так как любой перевод осуществляется не непосредственно, а двумя этапами: с первого конкретного языка (ИЯ – исходный язык) на язык-посредник (специальный язык), а затем с языка-посредника на другой конкретный язык ПЯ – переводящий язык), но зато потребуется меньшее количество систем правил, чем при переводе непосредственном.

Этот специальный язык может быть языком определенных логических символов, позволяющих передать точно слова и формы реального языка, отобранные таким образом, что он будет характеризоваться теми же свойствами, что и логический язык символов.

Правила перевода с любого данного языка на любой другой содержат, как уже было сказано, правила перевода слов и правила перевода грамматических средств (именно средств, а не форм, так как грамматической формой принято называть форму одного отдельного слова, каковой в некоторых языках может и не быть). Переводы слов содержатся в закодированном в порядке алфавита данного языка словаре. Но должны существовать и некоторые правила перевода слов, так как лишь сравнительно редко одно слово данного языка соответствует одному и только одному слову другого языка. Большей частью слово данного языка соответствует нескольким словам другого языка, и должен быть однозначно определен выбор слова второго языка из нескольких возможных.

Кроме того, в любом языке имеются особые фразеологические сочетания, значение компонентов которых не тождественно их значению вне этих сочетаний. Бывают случаи, когда одно слово переводимого языка (ИЯ) может быть переведено одновременно двумя словами другого языка (ПЯ), из которых читатель, знакомый с той специальной областью, к которой относится переводимый текст, сам выберет нужное по смыслу. Но такой двоякий перевод являлся лишь временной мерой; в дальнейшем были определены правила, согласно которым выбор одного из двух значений должна осуществлять машина.

Правила передачи грамматических средств должны учитывать как морфологическую, так и синтаксическую стороны обоих языков. В тексте ИЯ у каждого слова должны быть вычленены морфемы словоизменения, если они есть в языке. Это необходимо, во-первых, для поиска слова в словаре, где, совершенно очевидно, слово излишне давать во всех его формах и где приводятся лишь основы всех изменяемых слов; во-вторых, для определения (по этой словоизменительной морфеме) синтаксического отношения данного слова как зависимого в словосочетании к другому слову того же словосочетания или для определения значения глагольной формы (времени, наклонения, залога, иногда лица). При выделении основы должен быть учтен ее звуковой (точнее фонемный) вид (передаваемый на письме определенной графической формой), так как в ряде языков имеются так называемые чередования. Это необходимо, во-первых, для поиска в словаре, где любое слово дается в одном, принятом как основной, виде основы (с указанием на наличие других видов основы), во-вторых, для определения синтаксического отношения данного слова к другому, включая предикативные формы глагола, так как соответствующие значения в некоторых языках выражаются и чередованиями. В тексте ПЯ слова, найденные в словаре также в виду основ (если они не входят в состав устойчивых фразеологических сочетаний), должны быть снабжены словоизменительными морфемами, выражающими грамматические значения, свойственные словам ИЯ (если такие морфемы есть в ПЯ). Основам же нужно придать вид, свойственный формам слов, соответствующих по значению отношениям, выраженным в тексте ИЯ (даже если в ПЯ имеют место изменения основы). Синтаксическая сторона должна быть принята во внимание в двояком отношении. Во-первых, одни и те же отношения между членами словосочетания в ИЯ и в ПЯ могут быть выражены в одном морфологическими, а в другом синтаксическими средствами (т.е. посредством так называемых служебных слов или посредством порядка следования членов словосочетания), и при переводе должны быть использованы именно средства, свойственные ПЯ. Во-вторых, при переводе в ряде случаев должен быть изменен порядок слов согласно нормам ПЯ15.

Таким образом, порядок слов имеет существенное значение в тех языках, где он грамматикализован, т.е. где ряд отношений в пределах словосочетания выражается исключительно посредством порядка слов. Но порядок слов должен быть принят во внимание и в ряде случаев изменен сравнительно с текстом ИЯ и при переводе на такой ПЯ, в котором порядок слов не грамматикализован (как, например, в русском). Слова должны быть расположены в привычном для ПЯ порядке. При этом следует заметить, что в языке, где порядок слов не грамматикализован, последний может быть использован для выделения соответствующих членов, в то время как в языках с грамматикализованным порядком это выделение может осуществляться другими средствами, например, путем сопровождения выделяемых членов различными частицами. При переводе эти частицы могут опускаться, а выделение соответствующего члена может осуществляться посредством порядка слов (так, в русском языке выделение члена осуществляется преимущественно вынесением его на конец предложения, особенно в сочетании с дистантным положением членов словосочетания, в которое данный член входит)16.

При анализе текста применительно к некоторому данному языку прежде всего возникает вопрос о том, с каким отрезком мы имеем дело и на какие единицы он последовательно разбивается. Существенно определить, какой отрезок переводимого текста содержит грамматические связи, осуществляющиеся лишь внутри него и не переходящие за его границы. Определение границ такого отрезка представляет собой непростой процесс. Известную помощь оказывает пунктуация, но не во всех случаях. Практически берется отрезок, содержащийся между двумя точками, т.е. тот, который синтаксически представляет собой предложение, возможно, так называемое сложное предложение. Большая часть грамматических связей действительно заключается внутри него. Но, во-первых, внутри этого отрезка могут находиться различные отрезки, представляющие собой некоторые единицы, между которыми нет никаких грамматических связей. Это относится, прежде всего, к последовательности предложений, не связанных между собой никакими грамматическими средствами (союзами, относительными словами) и лишь разделенных на письме запятыми. Во-вторых, некоторые связи выходят все же за пределы отрезка, графически ограниченного точками. Это относится к местоимению типа он (она, оно), выбор форм которого в ряде языков может быть обусловлен принадлежностью к определенной категории (рода, лица и не лица и т.п.) существительного, лежащего за пределами данного отрезка 17.
2.3. Решение проблем механизации перевода
Любой прак­тический подход к механизации перевода ставит нас перед двойственной природой процесса перевода, обусловленной двойственной структурой языка. Естественные языки употребляют для передачи мысли одновременно две различ­ные условные системы. Одна из них представляет собой ряд дискретных символов, слов, другая - ряд условных пра­вил изменения слов и их комбинирования, указывающих на взаимозависимость и взаимосвязанность выраженных словами мыслей. Последние условные правила составляют область грамматики.

Практическое осуществление проблемы механизации перевода осложняется тем, что между отдельными систе­мами двух различных языков всегда наблюдаются значительные морфологические и синтаксические несоответствия. Какое-либо понятие может быть в одном языке выражено словом, а в другом - целой синтаксической конструкцией. Порой оттенок значения передается столь тонкими сти­листическими средствами, что не поддается точной форму­лировке, необходимой для программирования привил авто­матического перевода. Поэтому при переводе с языка А на язык Б точность смысла может быть утрачена, и ее восста­новление должно идти путем обратного перевода - с языка Б на язык А. Такие проблемы могут быть решены с некоторым приближением; ведь и опытным переводчикам приходится порой обращаться за разъяснениями к автору переводимой статьи для того, чтобы избежать неточностей в передаче некоторых оттенков значения в переведенном тексте, недостаточно четко выраженных в подлиннике 18.

С примером передачи невыраженных оттенков данного значения мы встречаемся при переводе английского опре­деленного и неопределенного артиклей the, а и an, для пе­редачи которых в русском языке не имеется соответствую­щих символов - слов, окончаний, аффиксов. Это может быть показано на примере следующих простых предложений (приведенный пословный перевод не принимает во вни­мание русских окончаний)19.

1) Вода содержит 11 % водорода.

Water contain 11 % hydrogen.

  1. Морская вода содержит также 6 х 10-7 % брома.

Sea water contain also 6 х 10-7 % bromine.

3) Золотоносный песок содержит также 0,38 % ванадия и 0,55% меди.

Gold-bearing sand contain also 0,38% vanadium and 0,55% copper.

  1. Воздух содержит также 0,94 % аргона.

Air contain also 0,94% argon.

  1. Атмосфера содержит также 0,94% аргона.

Atmosphere contain also 0,94 % argon.

Здесь между русской глагольной формой содержит и английской формой contains имеется прямое отношение «один к одному». Следовательно, для замены слова содержит словом contains не потребуется сложного грамматиче­ского анализа. Автоматическое оборудование может дать пословный перевод этих простых предложений:

1) Water contains 11 % hydrogen.

2) Sea water contains also 6 х 10-7 % bromine.

3) Gold-bearing sand contains also 0,38% vanadium and 55% copper.

4) Air contains also 0,94% argon.

5) Atmosphere contains also 0,94 % argon.

Первое, второе и четвертое предложения отвечают тре­бованиям порядка слов в английском языке (за исключением положения слова also, но для данного случая это неважно). Третье и пятое предложения этим требованиям не от­вечают. В соответствии с точным употреблением пятое пред­ложение необходимо исправить; оно должно иметь следую­щий вид: The atmosphere contains also 0,94% argon. Объяс­нить, почему в правильно построенном пятом предложении при слове atmosphere требуется определенный артикль, а в четвертом предложении при слове air артикля не требуется, довольно трудно. Следует решить и точно определить, смо­жет ли автоматическое оборудование так переводить без вмешательства человека введенные русские предложения, чтобы английские определенный и неопределенный артикли были употреблены правильно.

Третий образец предложения идентичен по своей син­таксической структуре второму. Из содержания третьего предложения следует, что его английский перевод должен был быть следующим: The gold-bearing sand contains also 0,38 % vanadium and 0,55 % copper. Вряд ли будут верными и вариант A gold-bearing sand и вариант Gold-bearing sand, так как очевидно, что речь идёт только о каком-то опреде­ленном песке. Контекст помог бы нам разрешить любое сомнение в техническом или научном переводе; для уста­новления контекста любого предложения человек может привлечь все ранее приобретенные им знания. Таким об­разом, проблема перевода артиклей является для конструк­тора или программиста почти неразрешимой20.

Не­большое различие в передаче значения возникает при вы­боре английского определенного или неопределенного артиклей в тех случаях, когда мы переводим с русского языка предложения типа Атом натрия содержит также 11 элек­тронов:

1) An atom of sodium also contains 11 electrons;

2) The atom of sodium also contains 11 electrons.

По суще­ству, оба варианта английского перевода передают одно и то же содержание. Английский язык требует артикля, и для выяснения того, какому переводу отдать предпочтение, здесь снова требуется контекст.

Подобная зависимость от контекста существует и при переводе русских возвратных глагольных форм. В русском языке возвратные глагольные формы при­меняются для обозначения целого ряда действий различ­ного типа. Возвратный глагол обозначает там часто дей­ствие, в котором грамматическое подлежащее может уча­ствовать по-разному, например и как исходный материал, и как конечный продукт. Это обычное употребление рус­ского возвратного глагола тесно связано с его употребле­нием для обозначения способности некой сущности или субстанции к изменению или процессу. А это последнее употребление в свою очередь связано с другим употребле­нием, а именно: с обозначением подверженности к некоторо­му изменению или процессу. Хотя эти употребления возврат­ного глагола так тесно переплетаются, что их невозможно точно разграничить, тем не менее соответствующие разли­чия в значении достаточно велики, чтобы обусловить не­обходимость тщательного разграничения при выборе эквивалентной английской глагольной формы. Это положение станет более ясным, если мы рассмотрим следующие предложения, для которых по-прежнему дан пословный под­строчный перевод (self употреблено здесь для передачи возвратного глагола, характеризующегося в русском языке суффиксом -ся).

6) При брожении глюкозы получаются этиловый спирт и углекислый газ.

At fermentation glucose obtain self ethyl alcohol and carbon dioxide.

produce self spirit

7) При высоком давлении многие газы сгущаются в жидкости

At high pressure many gas condense self in liquid

During thicken self into

8) При ядерных реакциях выделяется атомная энергия.

At nuclear reaction evolve self atomic energy.

During

9) При горении топлива химическая энергия превращается в теплоту.

At combustion fuel chemical energy convert self in heat.

During into.

10) Бумага изготовляется главным образом из дерева.

Paper prepare self principal form of wood

produce self main fashion from

11) Сталь широко применяется.

Steel widely use self.

wide apply self.

12) Эфир, сероуглерод и гексан быстро испаряются

Ether carbon disulfide and hexane rapidly evaporate self.

При осуществлении подстрочного перевода окончания русских существительных, прилагательных и глаголов не были приняты во внимание. Если бы удалось разработать методы, в результате применения которых автоматическое оборудование было бы способно определять число существи­тельных и глаголов, то качество пословного машинного перевода было бы более высоким и английский перевод тех же предложений выглядел бы иначе:

6) At fermentation glucose obtain self ethyl alcohol and carbon dioxide.

During produce self spirit

7) At high pressure many gases condense self in liquids.

During thicken self into

8) At nuclear reactions evolves self atomic energy.

During

9) At combustion fuel chemical energy converts self in heat.

During into

10) Paper prepares self, principal form, of wood.

produces self, main fashion, from

11) Steel widely uses self.

wide applies self.

12) Ether, carbon disulfide and hexane rapidly evaporate self.

Различение единственного и множественного числа за­метно улучшило качество перевода предложений 7, 8, 10 и 11. Слова глюкозы и топлива в предложениях 6 и 9 представ­ляют собой соответственно формы родительного падежа единственного числа, хотя в их переводе и нет прямых ука­заний на это в виде каких-либо окончаний. Одновре­менно слова глюкозы и топлива являются формами имени­тельного и винительного падежей множественного числа. Если бы анализ предложений и соответствующее программи­рование для автоматического оборудования можно было бы настолько усовершенствовать, что подобная многознач­ность была бы уничтожена, то предложения 6 и 9 могли бы быть переведены следующим образом:

6) At fermentation of glucose obtain self ethyl alcohol and carbon dioxide

During produce self

9) At combustion of fuel chemical energy converts self in heat.

During into

Рассмотрение русских окончаний не дает возможности разрешить основную проблему, возникаю­щую в предложениях 6 - 12: какие английские глагольные формы следует выбирать для перевода русских возвратных глагольных форм. В некоторых из этих предложений необ­ходимо употребить пассивную форму, но только в тех, в которых не требуется употребления какой-либо совершенно другой формы. Так, пассивную форму можно успешно упо­требить в предложениях 6, 8, 9, 10 и 11, но в предложении 12 это помешало бы правильной передаче смысла. Для предложения 7 вопрос о том, какую форму необходимо упо­треблять - пассивную или активную, - не имеет решающего значения для передачи смысла фразы на английский язык. Все сказанное обобщается в табл. 1.

Таблица 1

Проблемы перевода русских возвратных глагольных форм

предложения

Русская глагольная

форма

Требуемый тип английской глагольной формы

6

получаются

пассивная

are obtained

7

сгущаются

либо пассивная

are condensed

либо активная

Condense

8

выделяются

пассивная

is evolved

9

превращается

пассивная

is converted

10

составляется

пассивная

is produced

11

применяется

пассивная

is used

12

испаряются

активная

evaporate


Эти примеры иллюстрируют особо трудную проблему, которую можно сформулировать следующим образом: воз­можно ли разработать программу операций, которая по­зволила бы машине «решать» вопрос о том, какая форма английского глагола должна быть употреблена для перевода вводимого возвратного глагола? Конечно, предполагается, что при любой практически применяемой форме машинного перевода никакого предварительного редактирования тек­ста не должно быть. Факторы времени и стоимости исклю­чают анализ каждого вводимого предложения экспертом с последующим применением этого анализа как в качестве словарной статьи, хранящейся в запоминающем устройстве, так и в качестве специальной программы для машины.

При рассмотрении этой проблемы следует прежде всего отметить, что понимание переводчиком общего смысла пред­ложения облегчает ему выбор нужного эквивалента. Для машины же это, разумеется, невозможно, поскольку она не может уловить общего смысла предложения, а произ­водит только отдельные операции, на которые указывает специальный код или другие формальные признаки, как например порядок слов или пунктуация.

Установление ряда машинных операций для перевода возвратных форм русских глаголов - задача, родственная по своей природе той, которую приходится разрешать при выборе соответствующего английского артикля - опре­деленного или неопределенного. Переводчик разрешает эту задачу, принимая во внимание не только значения слов, приведенные в словаре, и грамматические характе­ристики предложений, но также и общий контекст. Поэтому для того, чтобы дать точный перевод, переводчик должен разбираться в научном, техническом или каком-либо другом содержании работы.

Особенно трудные задачи возникают при машинном переводе предлогов и форм родитель­ного, дательного, винительного и творительного падежей во всем разнообразии их употребления, а также при уста­новлении соотношения между русскими и английскими глаголами с их различиями в структуре и внутреннем со­держании.

При практическом осуществлении машинного перевода с русского языка следует в первую очередь определить, как лучше использовать элементы сходства между русским и английским языками. Использование соотношения «один к одному», позволяющего осуществлять простую замену, даст наилучший показатель стоимости перевода одного слова.



ЗАКЛЮЧЕНИЕ


История машинного перевода насчитывает немногим более 50 лет. За это время сменилось несколько поколений систем машинного перевода - от первых программ, использовавших ограниченные ресурсы универсальных компьютеров первого поколения до современных коммерческих продуктов, использующих мощные ресурсы серверов и персональных компьютеров, включая ПК, в которых можно размещать карманные словари, а также компьютерные сети.

По мере снятия технических ограничений, налагаемых возможностями компьютеров по производительности и памяти, становилось ясно, что проблема перевода текста с одного естественного языка на другой принципиально не сводится только к перекодировке слов. Для преодоления основных трудностей проблем машинного перевода должны быть решены:

  • задачи автоматизированного представления контекста;

  • смыслового содержания переводимого текста;

  • знаний о понятиях предметной области, к которой относится переводимый текст.

Как видно из всего сказанного выше, практические проб­лемы, возникающие при применении автоматического обо­рудования для перевода с одного языка на другой разнообразны и сложны. Однако это ни в какой мере не должно снижать интереса к развитию данной области техники.

Прогресс не стоит на месте, и с увеличением быстродействия процессоров и ростом объема оперативной памяти постепенно повышается и качество машинного перевода.

Конечная цель - создать такую машину, которая давала бы достаточно правильный перевод, не нуждающийся в последующем редактирова­нии. А пока еще машинный перевод нуждается в обязательном редактировании.

В работе была сделана попытка выполнить частичный перевод статьи, освещающей войну в Ираке, из журнала TIME, APRIL 7,2003, pp. 60-61 с помощью системы PROMP XT OFFICE (Приложение).

СПИСОК ЛИТЕРАТУРЫ





  1. Джемс В. Перри. Практическое осуществление проблемы механизации перевода. В кн. Машинный перевод. Сб. статей. Под ред. П.С. Кузнецова. – М.: Изд-во Иностранная литература, 1957. – 315 с. С. 237-345.

  2. История машинного перевода. Е. Н. Филинов // Виртуальный компьютерный музей. 07.10.2002 г.

  3. Опыты машинного перевода. Кузнецов П.С., Ляпунов А.А., Реформатский А.А. // Вопросы языкознания. № 5, 1956. – С.108-111.

  4. Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. – М.: Изд-во Высшая школа, 1964. – 243 с.

  5. Чеповский А. Неразрешимая проблема компьютерной лингвистики // Компьютерра №30 (455) 02.08.2002.

  6. Сайт www.computerra.ru.


Приложение

WHAT’S FAIR IN WAR?

By JOHN CLOUD


следующая страница >>