Особенности практического применения САТ-программ (на примере Wordfast и Promt)

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



вливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). Машина осуществляет синтаксический анализ предложения без опоры на значения составляющих его слов, с использованием информации только об их грамматических свойствах.

Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, их роли в данном предложении и пр.), производимое в рамках входного языка. Также на данном этапе происходит разрешение неоднозначности (скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом), поэтому машина должна решить к какой части речи относится каждое конкретное слово. Помимо этого, второй этап характеризуется анализом и переводом слов. Обычно на данном этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, притом, что в оригинале может быть и единственное число).

И наконец, последний этап включает в себя синтез выходных словоформ и предложения в целом на языке перевода. В память машины помимо наборов синтаксических правил для каждого языка вкладывают и правила преобразования синтаксических структур. К этому добавляют правила перехода от уже преобразованной структуры к предложению того языка, на который делается перевод. [6]

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера.

Действующие системы машинного перевода, как правило, ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения.

Для переводчика перевод, выполненный при помощи такой программы, может быть использован для поверхностного ознакомления с содержанием текста. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Если же переводчик пользуется данной программой для того, чтобы, например, сэкономить время, то после обработки машиной, необходим обязательный анализ и редактирование человеческой рукой.

1.2.4 Редакторское программное обеспечение

В данную группу входят все программы, которые переводчик использует на этапе постредактирования текста. Основная их цель - придать переведенному тексту связность, логичность, однородность. Выполнить перевод, учитывая все особенности переводящего языка.

Наиболее распространенными текстовыми редакторами среди переводчиков являются Microsoft Word и OpenOffice. Обе программы имеют много функций, которые большинство переводчиков не используют. Например, мало кто знает, что в этих программах можно задавать сочетания клавиш для вставки часто встречающихся словосочетаний. Важной функцией современных текстовых редакторов, позволяющей в разы сократить количество опечаток в переводах, является функция автоматической проверки орфографии и пунктуации.

Однако для тех, кому не хватает встроенных программ, существуют и отдельные программы для проверки грамматики, орфографии, стиля написания.

Такие программы как Spellchecker, SpelLink Multilingual Pro, GridinSoft Notepad , Intellexer Spellchecker SDK, JavaScript Spell Check работают с файлами с разными расширениями, а также с вэб-приложениями и Java- форматами.

Такая программа как Stylewriter помогает пользователю выстроить текст, избегая лишних повторов, слишком длинных предложений. Для каждого отдельного текста вводятся параметры стиля, таким образом, что, например, в документе официально-делового стиля не окажется просторечных, жаргонных и других выражений, не подходящих для стиля данного документа.

Для проверки грамматики также существует ряд программ: Language