Сравнение он-лайн переводчиков на примере перевода англоязычных юмористических текстов (на примере пяти популярных переводчиков)

Курсовой проект - Иностранные языки

Другие курсовые по предмету Иностранные языки

ассчитаны на работу не просто со словами и словосочетаниями, а с тем, как они употребляются в контексте, и позволяют получать сразу полный вариант текста на родном или иностранном языке. Для этого используются специальные алгоритмы, связывающие переведенные фрагменты в структуре предложений в соответствии с правилами грамматики и т. д. Понятно, что результат работы такого приложения может отличаться от привычного текста (например, если в нем используются аббревиатуры, литературные приемы, жаргон и другие сложные для перевода конструкции).

Однако это нормально: для обычного пользователя электронный переводчик обычно играет роль приложения для схватывания общей информации - о чем говорится в тексте или для базового перевода на иностранный язык. Грамотный и образованный человек, прочитавший такой перевод, все домыслит самостоятельно и исправит стилистические ошибки. Кроме того, программа переводчик подойдет для перевода текста, написанного на незнакомом языке, - ради однократной процедуры никто не будет с нуля учить иностранный язык или прибегать к помощи специалистов.

Переводчик может быть реализован как в виде приложения, так и в виде веб-сервиса. В первом случае он напоминает текстовый редактор, к которому подключены специальные инструменты, отвечающие за настройку перевода (направление, фиксированный перевод известных слов и оставление непереведенными определенных выражений и т. д.) с базами данных по каждому языку. Такая программа может интегрироваться с другими приложениями на компьютере, например, с редакторами из Microsoft Office, онлайн-мессенджерами, веббраузерами, что позволяет получать перевод непосредственно в этих приложениях без необходимости копирования фрагмента текста в переводчик, причем с сохранением форматирования и структуры текста. Переводчик в виде веб сервиса задействует ресурсы приложения, установленного на удаленном сервере. Здесь от пользователя требуется только веб-браузер или клиент для работы с сервисом (второе чаще нужно на мобильном устройстве), а также доступ в Сеть. Вы можете скопировать или ввести текст для перевода в переводчик или же перевести нужный контент через расширения браузера - например, панели перевода (Mozilla Firefox), плагины (Google Chrome) или ускорители (Internet Explorer 8). Преимущество программ-переводчиков в том, что сама процедура перевода осуществляется локально на компьютере, без интернет-подключения. Кроме того, пользователю предоставляются значительно более подробные настройки автоматического перевода, чем в веб-сервисе (в последнем обычно можно только переключить направление и тематику), и их сохранение для различных проектов. Веб сервис выигрывает за счет готовности итогового перевода, интеграции с основным источникоминформации (браузером), а также бесплатной моделью использования (в то время как все настольные системы перевода платные)

(источник:

 

1.1 Технологии, на которых работают он-лайн транслейторы

 

Каким же образом программе удается связно переводить текст с одного языка на другой? Какие технологии машинного перевода (МП, machine translation) разрабатываются сегодня? Что ждет машинный перевод в ближайшем будущем?

Есть две конкурирующих технологии машинного перевода: традиционная (rule-based machine translation) - основанная на правилах и статистическая (statistical-based machine translation). Обе технологии имеют свои плюсы и минусы, приверженцев и противников, и сегодня в Интернете часто обсуждается вопрос, какая из них позволяет получить наиболее качественный результат. Особенно активно противопоставляются друг другу технологии rule-based и statistical-based после запуска бесплатного сервиса онлайн-перевода Google (основанного на статистическом методе) [В сервисе Google на базе статистической технологии работают только те направления перевода, которые помечены как BETA-версии]. Попытаемся выяснить, какая же из этих технологий лучше.

Перевод по правилам Rule-based machine translation - это метод, используемый большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.), его еще называют традиционным методом машинного перевода. Технология основана на применении правил (алгоритмов), когда программа анализирует текст и на основе проведенного анализа синтезирует вариант перевода. Работа такой системы сходна с процессом мышления человека: система анализирует текст, используя множество алгоритмов.

Представителем систем, которые основаны на традиционной технологии перевода, являются программы-переводчики PROMT, разрабатываемые специалистами одноименной российской компании. Процесс перевода, выполняемый системами PROMT, можно условно разделить на несколько этапов.

Морфологический анализ слов.

Приступив к переводу текста, программа в первую очередь анализирует слова в каждом предложении с точки зрения морфологии, то есть указывает род, число, лицо и другие морфологические характеристики. На данном этапе программа не решает вопрос грамматической многозначности, а только фиксирует эту информацию. Например, если слово может принадлежать к разным частям речи: английское слово blow может употребляться как глагол (дуть, веять) или как существительное (порыв ветра, дуновение), то система определит, что blow - это форма настоящего времени, 1 или 2 лица единственного или множественного числа, либо 3 лица множественного числа, а также форма инфинитива.

Анализ и синтез групп.

После морфологического анализа система выпол