Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Дипломная работа - Иностранные языки

Другие дипломы по предмету Иностранные языки

? распространенные сложные предложения. Если разбивать такие предложения, то текст будет легче для восприятия. Переводчик-человек может учесть этот факт и упростить авторский текст.

При этом будет потерян авторский стиль. Подобную ситуацию можно наблюдать в пятом и девятнадцатом предложении первого отрывка, во первой части двадцать пятого предложения второго отрывка.

СМП не обладает информацией о мысли, которую хотел донести автор. Она оперирует только лингвистическими знаниями и никакой разбивки предложений не производит.

Возможна и обратная ситуация, когда мысль автора выражена не одним, а несколькими предложениями. В этом случае, переводчик имеет право соединить две части высказывания, чтобы нагляднее донести мысль автора. СМП переведет авторский текст так, как он есть, без каких либо изменений структуры. Подобная ситуация прослеживается в последнем предложении третьего отрывка.

В англоязычной научной прозе для сложносочиненных предложений часто используют знак препинания точка с запятой. В отечественной литературе знак используется только для маркированных списков.

При анализе оригинального текста на английском языке (особенно математического), заранее не известно, какую функцию несет точка с запятой. Потому в этом случае, СМП не меняет структуры. Но человек, следуя отечественной традиции, может поменять знаки препинания.

Подобную ситуацию можно наблюдать в третьем и восьмом предложениях первого отрывка, в третьем, шестом, восьмом предложении и в первой части двадцать пятого предложения второго отрывка, в седьмом предложении третьего отрывка.

Рассматриваемый текст имеет четкую структуру. Первый отрывок делится на шесть абзацев и без учета алгоритма содержит двенадцать предложений. Второй отрывок делится на семь абзацев и содержит двадцать восемь предложений. Третий отрывок содержит четыре абзаца и содержит тринадцать предложений.

В каждом абзаце выдвигается определенное предположение, которое в нем же и доказывается. Например, в начале второго отрывкаcontrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc.

Ниже до начала следующего абзаца рассказывается о непрерывном моделировании и его отличиях от дискретного.

В отрывке можно предложения с прямым порядком слов, которые можно iитать определениями.

... algorithm is basic to all of computer programming...

... that [common divisor] is, the largest positive integer that divides both m and n.

... n is the answer ...

В научно-техническом тексте достаточно часто встречаются и обычные настоящие определения. В рассмотренных отрывках виде они в явном виде не встретились. Малое количество определений в отрывках еще раз подчеркивает, что реальные научные тексты обладают стилистической неоднородностью. Часто автору проще донести свою мысль косвенно, неприбегая к именованию. Последнее представляет значительную сложность для СМП, так как тут не всегда можно обойтись эквивалентными трансформациями.

Четвертое предложение второго отрывка:a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time тАж

Переводчик передал фразу как неявное определение:

При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента тАж

Что может быть передано в явном виде как

Процесс моделирования - суть выполнение определенных действий, предусмотренных для данного момента тАж

Однако СМП передали это предложение с сильным искажением:

Статистическая СМП:

В дискретного моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования тАж

Трансфертная СМП:

На дискретном моделировании мы продолжаем, делая независимо от того, что должно быть сделано в определенный момент моделируемого времени тАж

Машины перевели максимально близко к тексту автора, однако основная идея высказывания была потеряна. Для научного текста - это серьезная проблема. На данном этапе развития технологий не представляется возможным автоматизировано, в общем случае, выделять дефидент и дефиницию для неявных определений.

Существует несколько вариантов решения этой проблемы:

предобработка исходного текста, на предмет разрешения подобных смысловых групп, и их преобразования в явные;

чтение машинного перевода текста параллельно с оригиналом;

Однако, ни один из способов не может быть удовлетворителен, так как потребует дополнительных затрат времени и дополнительных знаний.

Методы автоматического построения синонимичных конструкций на данный момент так же требуют доработки. При их применении опять же потребуется проверка результата. И мы придем опять к той же проблеме. Остается надеяться, что проблема разбора неявных определений иiезнет в недалеком будущем.

Следующий пример тоже можно iитать определением.

Второе предложение второго отрывка:

"Discrete simulation" means the simulation of a system тАж

Обе СМП и переводчик

Дискретное моделирование означает моделирование системы тАж

Совпадение всех трех вариантов перевода объясняется логичностью и простотой фразы.

Большая часть предложений имеет прямой порядок слов. В тексте преобладают сложноподчиненные предложения. На шестьдесят одно предложение всех трех отрывков (без учета алгоритма Евклида) было обнаружено двадцать девять сложноподчиненных предложений, что составляет примерно сорок семь процентов.

Большая часть придаточных предложений в рассматр