Сравнение он-лайн переводчиков на примере перевода англоязычных юмористических текстов (на примере пяти популярных переводчиков)
Курсовой проект - Иностранные языки
Другие курсовые по предмету Иностранные языки
не только неправильно перевел прилагательное, но и не согласовал падеж слова orphanage (если опустить прилагательное, получается бессмысленное из приюте). Однако, в отличие от перевода PROMT, предлог сервис Google выбрал правильно: bring FROM - привести ИЗ.
Во-вторых, перевод слова bringing в варианте Google вообще отсутствует. Исчезновение слов или фраз при переводе недопустимо и является очень грубой ошибкой. Даже при отсутствии в словарных базах системы варианта перевода (а такое возможно) программа должна подставить в переведенный текст слово как есть - в нашем случае английское bringing. Если же программа действует по принципу: нет перевода - нет слова, то смысл переведенного текста вряд ли будет понятен пользователю. Единственный вариант в данном случае - кропотливо сравнивать исходный и переведенный тексты, чтобы обнаружить пропавшее слово и самостоятельно перевести его, если позволяет квалификация. Тогда возникает вопрос: зачем нужна система перевода, если приходится переводить самому?
Связно перевести вторую часть предложения сервису Google не удалось. В получившемся варианте (это только показать, что она идентична близнецы, а также за рубежом) члены предложения не согласованы с точки зрения синтаксиса, и в результате теряется смысл текста. Система PROMT успешно справилась с этим фрагментом: только для этого, чтобы показать, что у нее есть идентичная сестра-близнец, также принятая за границей.
Мы также предложили сервису Google перевести фрагмент новости о футболисте Дэвиде Бекхэме, однако результат перевода предложения Beckham may find LA a refreshing change once the hype and novelty wears off также оказался неудачным: Бэкхем может найти LA освежающий измениться после того, ажиотаж и новизна носит удалиться. К сожалению, иначе как бессмысленным набором слов такой перевод назвать нельзя. Напрашивается вывод, что мы имеем дело с примитивным подстрочником, и система, не найдя связного перевода предложения в базе, тупо подставила перевод каждого слова по отдельности.
Очевидно, что причина нелепостей при переводе статистическим методом заключается в недостаточном объеме параллельных баз текстов из различных областей знаний. В традиционных системах перевода, работающих на основе правил, есть возможность настройки программы для перевода текстов со специализированной терминологией. В частности, можно подключить тематические словари, создавать и редактировать собственные словари, резервировать слова, не требующие перевода, и т. д. Результат перевода после настройки системы приведен в табл. 3.
Использование возможностей настройки не отразится на объеме занимаемой программой памяти. В статистических системах необходимым условием является наличие достаточного количества параллельных текстов по любой тематике, что требует значительного объема памяти ПК и огромных трудозатрат по занесению N-грамм в базы. По всей видимости, сегодня эта задача еще не нашла достойного решения.
Стоит также отметить, что технология перевода статистической системой построена на анализе параллельных текстов, и программа может менять результат перевода в зависимости от контекста анализируемых баз. В результате перевод одного и того же термина может быть разным, так как система вычисляет вероятность (наибольшее количество) совпадений перевода данного слова в определенном контексте. В отличие от статистического метода, технология rule-based гарантирует одинаковый перевод одного и того же термина, что особенно актуально для корпоративных пользователей, которые переводят тематическую информацию со специализированными терминами.
К сожалению, снова первыми бросаются в глаза недостатки перевода Google. Начало стандартного предложения The employee is being hired сервис перевел выдуманным словосочетанием Работника на работу, опустив сказуемое нанимается (is being hired). Кроме того, переводчик Google убрал из текста перевода название компании - MTSS. О смысле получившейся фразы обеспечения безопасности признаются компании должности и органа (оригинал звучит как providing security of MTSS Company office) остается только догадываться. Вместе с тем, PROMT идеально перевел этот фрагмент: обеспечение безопасности офиса компании MTSS.
Однако с некоторыми нюансами сервис Google справился лучше соперника. Во-первых, термин the employee был корректно переведен как работник, а не служащий (вариант перевода PROMT). Во-вторых, выражение as a security было правильно переведено Google как в качестве охранника, в отличие от угловатого как охранник, предложенного PROMTом. Более гладко переведено и последнее предложение в примере: The employee also agrees to perform additional duties incidental to the general job description - Также работник обязуется выполнять дополнительные обязанности.... Но непонятно, почему союз также стоит в начале предложения: нарушается строгий стиль текста - важное условие, которое необходимо соблюдать при переводе юридических документов.
В целом, создается впечатление, что перевод Google состоит из отдельных кусочков (фраз), что, по сути, верно. В процессе перевода система ищет в базах параллельные словосочетания, не анализируя при этом грамматику языков. Если пользователю повезет и в базе системы есть аналогичный текст, тогда на выходе система выдаст вполне приличный перевод. Если перевод в базе отсутствует, тогда Google смело выдает примитивный подстрочник, не потрудившись связать слова в осмысленное предложение.
Исхо?/p>