Инновации в исследованиях русской литературьi традиционные представления о море в сознании жителей русского севера начала XX века
Вид материала | Документы |
СодержаниеЭксперименты с автоматической проверкой заданий по переводу (на материале практической грамматики) |
- Традиции «идеологического романа» Ф. М. Достоевского в русской прозе конца ХIХ начала, 632.99kb.
- Лексические инновации в русском языке начала XXI века (2000 2009 гг.), 213.46kb.
- Антропологические художественные модели в русской поэзии начала ХХ века в контексте, 661.58kb.
- Задачи: сохранение культуры и традиций народных ремесел Русского Севера; популяризация, 60.63kb.
- Тема урока в соответствии с фкгос, 266.23kb.
- -, 496.63kb.
- Основы русского искусства xix-нач. XX века, 20.16kb.
- Тема: Традиционные средства физического воспитания народов Севера, 54.08kb.
- Державинская традиция в русской литературе XIX начала XX века, 683.99kb.
- Курс лекций по русской литературе конца XIX начала XX века для студентов факультета, 1755.86kb.
Литература
Арнаудов 1976: Д. Арнаудов. Практическое пособие по русскому языку для студентов ВИИИ им. Н. Павловича. София, изд. “Наука и изкуство”, 1976.
Даниленко 1973: В.П. Даниленко. Научно-техническая терминология, № 10, 1973.
Даниленко 1977: В.П. Даниленко. Русская терминология. Опыт лингвистического описания. Москва, изд. “Наука”, 1977.
Иванникова 1972: Е.А. Иванникова. К вопросу о взаимоотношении понятия варианта с понятием синонима. // Синонимы русского языка и их особенности. Ленинград, 1972.
Канделаки 1967: Т.Л. Канделаки. Об одном типе словаря международных терминоэлементов. // ФН, N 2, 1967.
Калинина 1987: Р.П. Калинина. Термины кузнечно-штамповочного производства в лексической системе русского языка (функционально-парадигматическое описание). АКД. Днепропетровск, 1987.
Квитко 1976: И.С. Квитко. Термин в научном документе. Ленинград, 1976.
Краткий словарь 1965: Краткий словарь терминов изобразительного искусства. Москва, изд. “Сов. художник”, 1965.
Лейчик 1986: В.М. Лейчик. Семантические и формальные признаки терминоэлементов // Полуаффиксация в терминологии и литературной норме. Владивосток, 1986.
Молодец 1983: В.Н. Молодец. Некоторые проблемы терминологической синонимии. // Термин и слово. Предметная отнесенность и функционирование терминов. Горький, 1983.
Мурдаров 1983: Вл. Мурдаров. Съвременни словообразователни процеси. София, изд. “Наука и изкуство”, 1983.
Павловский 1975: А.С. Павловский. Материалы и техника монументально-декоративного искусства. Москва, 1975.
Тогунов 1980: Б.М. Тогунов. Суффиксальная семантическая конденсация как один из способов терминообразования. // Лингвистические аспекты терминологии. Воронеж, 1980.
Школа 1960: Школа изобразительного искусства, вып. V. Москва, 1960.
ЭКСПЕРИМЕНТЫ С АВТОМАТИЧЕСКОЙ ПРОВЕРКОЙ ЗАДАНИЙ ПО ПЕРЕВОДУ (НА МАТЕРИАЛЕ ПРАКТИЧЕСКОЙ ГРАММАТИКИ)
Иванка Атанасова, Великотырновский университет, Р. Болгария,
ivanka49@mail.bg;
Преслав Наков, Калифорнийский университет-Беркли, США,
nakov@cs.berkeley.edu;
Светлин Наков, Софийский университет, Р. Болгария,
svetlin@nakov.com
Ivanka Atanasova, Preslav Nakov, Svetlin Nakov
machine translation, computer-assisted language learning.
The paper presents an experiment for automatic evaluation of translation exercises given to Bulgarian students learning Russian as a foreign language. We study the applicability of BLEU, a standard machine translation evaluation algorithm, in teaching Russian practical grammar. Comparing our present results to those from previous experiments on fine arts texts, we conclude that while BLEU is good for practice exercises, it cannot be used to grade a real test, since it does not allow for translation variants and cannot indicate or qualify the student’s errors.
В настоящей работе представлен эксперимент автоматической проверки и оценки качества перевода учебных текстов по практической грамматике болгарских студентов, изучающих русский язык.
Цель работы – исследовать степень применимости автоматической проверки и оценки качества перевода в обучении по русской практической грамматике. В статье поставлены и следующие задачи: установить, при каких условиях этот способ эффективен; сравнить результаты проверки и оценки автоматического перевода грамматических упражнений и художественных текстов. Для сравнения текстов оригинала и перевода мы использовали алгоритм BLEU (BiLingual Evaluation Understudy33), разработанный Папинени, Рукосом, Уардом, Жу [Papineni et al. 2002, p. 311-318]. BLEU оценивает качество машинного перевода посредством сравнивания текста, переведенного компьютерной программой, с переводом одного или нескольких образцов, подготовленных профессиональными переводчиками, т. е. людьми, а не машинами. В результате получается цифровая оценка близости перевода и образца: число между 0 и 1, где 1 полное совпадение, а 0 – полное несоответствие. Ниже мы будем умножать это число на 100, чтобы получить процент.
В процессе оценки алгоритм учитывает следующие параметры:
1. Количество общих последовательностей длиной в 1, 2, 3 и 4 слова.
2. Частоту каждого слова в переводе и в образце.
3. Длину перевода и образца (как отдельных предложений, так и всего текста), которая не должна отличаться очень значительно.
В алгоритме не содержится информации о грамматике (синтаксисе и морфологии) языка перевода. Если, например, вместо слова себя студент неправильно написал себе (т. е. допустил падежную ошибку), для программы это такая же ошибка, как если бы студент написал тебе, или мне, или крокодил, или обезъяна, или Буш.
Материалом для настоящего эксперимента послужили переводы словосочетаний и предложений, включенные как самостоятельные упражнения по грамматике в письменный экзамен по Корректировочному курсу для студентов первого курса отделения Прикладной лингвистики Великотырновского университета имени Святых Кирилла и Мефодия, изучающих русский язык в качестве первого иностранного языка.
Студенческие переводы упражнений по грамматике были распределены на две группы, которые были анализированы в отдельности с целью сравнения результатов. В экспериментах приняла участие одна студенческая группа в восемь человек.
Переводы студентов оценивались преподавателем по следующим критериям: количество грамматических ошибок и количество лексических ошибок. Орфографические ошибки учитывались следующим образом: три орфографические ошибки равнялись одной лексической или грамматической ошибке. Пунктуационные ошибки не учитывались.
В первую группу упражнений включены словосочетания, относящиеся к темам: "Род и число имен существительных" и "Причастия". В первое упражнение входят преимущественно однокорневые имена существительные, расходящиеся в роде или числе в обоих языках. Участникам эксперимента были предоставлены для перевода с болгарского на русский язык следующие упражнения по практической грамматике.
Упражнения на перевод словосочетаний
упр. 1. Червена ябълка, интересен цитат, българска войска, огромна зала, безплатна рецепта, плодова салата, актуален проблем, голяма торта, смела постъпка, точна прогноза, зимни дрехи, летни обувки, съвременни мебели, политически борби, вкусни макарони, лятна ваканция, детски ясли, голяма ножица, стенен часовник, слънчеви очила.
упр. 2. Спяща красавица, действащ вулкан, пеещ часовник, учаща се младеж, изоставащ ученик, заспало дете, разтопен сняг, закъснял пътник, предполагаем отговор, необитаем остров, непроизносими съгласни, несклоняеми съществителни, открит урок, забравен учебник, забранен филм, отложен изпит.
Переводы словосочетаний проверялись и оценивались преподавателем по количеству ошибок и автоматической программой (BLEU) в процентах. Результаты представлены в следующих диаграммах.
Преподаватель – словосочетания Bleu – словосочетания
При сравнении результатов проверки преподавателем и BLEU были установлены сходства и расхождения. Результаты по успеваемости оказались сходными в пяти случаях – при студентах 2, 3, 4, 7, 8, и они заняли одно и то же место в обоих списках (с учетом двух первых и двух вторых мест в списке преподавателя из-за одинакового количества ошибок).
I. Совпадения в количестве ошибочных слов.
Одинаковое количество ошибочных слов наблюдается в тех случаях, когда в слове допущена только одна ошибка – грамматическая или лексическая, например: детские яслы (7)34 вм. ясли; непроизносимые согласны (7) вм. согласные; несклоняемые существительны (7) вм. существительные; отставающий (5, 7, 8), отстававшй ученик (4) вм. отстающий; раставший (7, 8), растаянный (1), растаящийся снег (2) вм. растаявший; действуйщий (6), действуйший (3), настоящий вулкан (2) вм. действующий; запретный фильм (3) вм. запрещенный; заснутый ребенок (7) вм. заснувший; певучие часы (1) вм. поющие; болгарское войска (3) вм. войско; овощной салат (4) вм. фруктовый.
II. Расхождения в количестве ошибочных слов наблюдаются в нескольких случаях.
1. Использование лексических синонимов вместо образца, предложенного преподавателем, например: уснувший ребенок (4) вм. заснувший; опоздавший путник (3, 5, 7) вм. пассажир.
В приведенных примерах только BLEU учитывает ошибки, так как сравнивает перевод студентов с переводом преподавателя.
2. Ошибки в роде и числе однокорневых существительных, например: интересный цитат (4) вм. интересная цитата; болгарские войски (4) вм. болгарское войско; вкусная макарона (1) вм. вкусные макароны; детское ясло (1) вм. детские ясли; зимние одежды (6, 7) вм. зимняя одежда; политические борьбы (3, 7) вм. политическая борьба; большая ножница (3, 8) вм. большие ножницы.
При словосочетаниях ошибка в роде или числе существительного приводит к ошибке определяющего прилагательного. В таком случае проверяющий отмечает одну ошибку, а BLEU учитывает каждое отдельное слово.
3. Неправильный перевод имен существительных, причем они расходятся в числе с соответствующими эквивалентами, например: детский сад (3, 8) вм. детские ясли; вкусная лапша (7), вкусная паста (5) вм. вкусные макароны.
Преподаватель рассматривает словосочетание как одно целое и поэтому учитывает одну ошибку, а BLEU регистрирует ошибки в каждом отдельном слове.
4. Орфографические ошибки, например: безплатный (4) вм. бесплатный; необытаемый (3, 6) вм. необитаемый; опаздавший (5) вм. опоздавший; вулькан (4) вм. вулкан; цытата (3) вм. цитата; остающий (1) вм. отстающий; спящяя (4) вм. спящая.
BLEU учитывает ошибку в каждом слове, а преподаватель приравнивает три орфографические ошибки к одной грамматической или лексической ошибке.
Во вторую группу упражнений включены предложения, относящиеся к темам: "Категория одушевленности", "Предлоги", "Степени сравнения прилагательных", "Глаголы движения". Участникам эксперимента были предоставлены для перевода с болгарского на русский язык следующие упражнения по практической грамматике.
Упражнения на перевод предложений
упр. 1. Андрей нарисува момче и момиче. Астрономите наблюдават Венера и Нептун. Сергей чете "Майсторът и Маргарита". Майката изпрати дъщеря си на училище. Учителката изпита двама ученика и три ученички. Момчетата играят на пътешественици, а момичетата на кукли. Ловците видяха странно чудовище.
упр. 2. Забравих си ключа от квартирата. Елена живее при родителите си. Студентите се готвят за изпит. Девойката беше облечена с бяла блуза. Старецът разказваше за живота си. Зоя отиде при лекаря. Зоя беше при лекаря. Зоя се върна от лекаря. Петър купи лекарство против ангина. Мая се омъжи за журналист. Павел се ожени за учителка. Децата вярват в приказките и легендите. Брат ми свири на китара. Спортистът е уверен в победата.
упр. 3. Витоша е по-ниска от Пирин. Речникът е по-дебел от учебника. Златото е по-скъпо от среброто. Крушата е по-сладка от ябълката. Дунав е най-дългата река в Европа. Байкал е най-дълбокото езеро в света. Рила е най-високата планина в България. Това е най-малкият ми брат.
упр. 4. Рибите плуват. Олег плува към брега. Птиците летят. Самолетът лети за Москва. Всеки ден ходя на занятия. Днес отивам на концерт. Децата бягат по двора. Петър тича към топката.
Переводы предложений проверялись и оценивались преподавателем по количеству ошибок и BLEU в процентах по тем же самым критериям, что и переводы словосочетаний. Результаты представлены в следующих диаграммах.
Преподаватель – предложения Bleu – предложения
При сравнении результатов проверки преподавателем и BLEU были установлены сходства и расхождения. Результаты по успеваемости оказались сходными в трех случаях – при студентах 1, 6, 7, и они заняли одно и то же место в обоих списках.
I. Совпадения в количестве ошибочных слов.
Одинаковое количество ошибочных слов наблюдается в тех случаях, когда в слове допущена только одна ошибка – грамматическая или лексическая, например: наблюдают Венера (2, 7) и Нептуна (2, 3, 4, 7) вм. Венеру и Нептун; читает Мастер и Маргарита (1, 2, 3) вм. Мастера и Маргариту; играют в путешественников (5), в путешественниках (1) вм. в путешественники; играют в кукол (5), в куклах (1) вм. в куклы; проводила дочери (5) вм. дочь; проводила в школе (7) вм. в школу; двух ученика (5, 8) и трех ученицы (8) вм. двух учеников и трех учениц; верят в сказках и легендах (3, 8) вм. в сказки и легенды; вернулась с врача (4, 8), из врача (1) вм. от; уверен в победу (5) вм. в победе; играет на гитару (5) вм. на гитаре; от ангиной (7) вм. от ангины; хожу на занятиях (8), на занятий (5), на занятии (7) вм. на занятия; рыбы плывут (7) вм. плавают; моложайший (5), меньчайший (8) вм. младший; сладче (4), сладчайше (1), сладше (6) вм. слаще; ловцы (7) вм. охотники; спортист (3, 6, 7) вм. спортсмен; круша (3) вм. груша; дальнейшая река (2) вм. длиннейшая.
II. Расхождения в количестве ошибочных слов наблюдаются в нескольких случаях.
1. Использование лексических синонимов или синонимических предлогов вместо образца, предложенного преподавателем, например: дочку (2) вм. дочь; блузке (3) вм. кофточке; пришла от врача (5) вм. вернулась; бегают во дворе (8), на дворе (3) вм. по двору; проэкзаменовала (7) вм. спросила; отправила (6) вм. проводила; против ангины (4) вм. от.
В приведенных примерах только BLEU учитывает ошибки, так как сравнивает перевод студентов с переводом преподавателя.
2. Замена слова синонимическим словосочетанием, например: дороже серебра (5, 8) вм. чем серебро; слаще яблока (5) вм. чем яблоко.
И в этих примерах только BLEU учитывает ошибки – замену окончания и появление нового слова (союза чем).
3. Ошибки в предложно-падежных сочетаниях и использование сложной превосходной степени прилагательных вместо простой, например: странного чудовища (5, 6, 7, 8) вм. странное чудовище; спросила двое ученика и трое ученицы (4) вм. двух учеников и трех учениц; готовится об экзамене (4) вм. к экзамену; женился для учительницы (1) вм. на учительнице; одета в белой кофточке (6), с белой кофточкой (4) вм. в белую кофточку; уверен победой (7) вм. в победе; самое глубокое озеро (4, 7) вм. глубочайшее; самая длинная река (4) вм. длиннейшая; самая высокая гора (4) вм. высочайшая.
BLEU учитывает большее количество ошибочных слов – замену предлога и окончания или двух окончаний в атрибутивном словосочетании; замену простой (однословной) формы превосходной степени сложной формой (словосочетанием). Во всех этих случаях преподаватель учитывает по одной ошибке.
4. Орфографические ошибки, например: путешественики (3, 4, 7) вм. путешественники; длинейшая (5) вм. длиннейшая.
В приведенных примерах BLEU учитывает ошибку в каждом слове, а преподаватель приравнивает три орфографические ошибки к одной грамматической или лексической ошибке.
5. Преподаватель не считает некоторые ошибки, касающиеся неизученного учебного материала или имеющие несущественное значение, например: Дунав (3, 7, 8) вм. Дунай; поженился (1, 6, 7) вм. женился; испроводила (8) вм. проводила; девушки (7) вм. девочки.
BLEU отмечает каждую ошибку, так как сравнивает перевод студентов с переводом преподавателя.
На следующем этапе работы были подсчитаны усредненные результаты автоматической проверки и проверки преподавателя перевода словосочетаний и предложений. Ниже приводим соответствующие диаграммы.
Анализ результатов проведенных экспериментов дает нам основание сделать некоторые выводы.
1. Преподаватель и автоматическая проверка ставят одних и тех же студентов на первых и последних местах по успеваемости как при переводе словосочетаний, так и при переводе предложений. Совпадения в позиции студентов по успеваемости (с учетом одинакового количества ошибок при проверке преподавателя) наблюдаются в 62,5% случаев при переводе словосочетаний, в 37,5% случаев при переводе предложений и в 50% случаев при усредненных результатах переводов. Меньшее количество совпадений при переводе предложений можно объяснить расхождениями в оценке предложно-падежных словосочетаний, где преподаватель учитывает одну ошибку, а BLEU считает ошибки в каждом слове. Перевод предложений предоставляет большие возможности использования синонимических конструкций (включая и предложно-падежные варианты), где автоматическая проверка учитывает некоторое количество ошибок, а преподаватель – ноль ошибок. При переводе словосочетаний применяется тот же самый критерий оценки предложно-падежных и синонимических конструкций, однако отсутствие косвенных падежей снижает общее количество ошибок и, следовательно, количество расхождений.
2. При переводе упражнений по грамматике и художественных текстов с болгарского языка на русский совпадения в позиции студентов по успеваемости наблюдаются в 50% случаев, при переводе текстов художественной литературы с русского языка на болгарский – в 60% случаев и в 55% случаев при усредненных результатах переводов художественных текстов. Меньшее количество расхождений в переводе на болгарский язык можно объяснить аналитическим характером болгарского языка, а большее количество расхождений в переводе на русский язык – аналитико-синтетическим характером русского языка. Данные приводятся по нашим экспериментальным наблюдениям [Кирова, Атанасова, Наков, 2006]. Разница в совпадениях позиций студентов по успеваемости при переводе грамматических упражнений и художественных текстов всего 5%, т.е. результаты практически не зависят от характера текста для перевода.
3. Автоматическая проверка достигает лучших результатов при переводе лексико-грамматических словосочетаний, не имеющих синонимических вариантов, и исключающих косвенные падежи.
4. Существенным недостатком BLEU является то, что она не указывает на конкретные ошибки и варианты перевода. Вот почему ее не следует использовать на экзамене, а можно применять только на учебных занятиях или в Интернете при самоподготовке студентов.