Інформаційні технології в журналістиці: вітчизняний І світовий досвід Київ 2002

Вид материалаДокументы

Содержание


Електронні кишенькові перекладачі
Подобный материал:
1   ...   11   12   13   14   15   16   17   18   19

Товкмач в коробочці

( Електронні кишенькові перекладачі)

Тетяна Литвин


Електронні словники не можна вважати повноцінними перекладачами – вони не перекладають тексти як такі. Автоматизований переклад текстів – досить важка проблема, яка в даний час далека від свого повного вирішення. Потрібні складні алгоритми граматичного і смислового розборів, реалізувати які на кишенькових приладах сьогодні не доцільно. Навіть спеціалізовані програми для настільних комп’ютерів не забезпечують якісного перекладу. Але для інших цілей електронні словники досить зручні. Набрати на клавіатурі потрібне слово і миттєво побачити його переклад значно простіше, ніж порпатись в об’ємних книжкових словниках.

На українському ринку відомі електронні перекладачі Citizen, Language Teacher, Forum, Quasar, Vectron, “Словотрон”.

Один із основних параметрів, через який можна порівняти електронні перекладачі між собою, - словниковий запас. Він може досягати 650 тис. слів. Так звані “туристичні” і “шкільні” словники мають менший запас слів. Однак, потрібно чітко з’ясувати при цьому, що мають на увазі, бо в одних випадках вказується кількість окремих слів, а в іншому – кількість словникових статей.

Словникових статей в декілька разів менше, ніж окремих слів, і вони приблизно відповідають словниковим статтям звичайного словника. Крім того, в багатомовних словниках вказану загальну кількість слів потрібно, як правило, розділити на кількість мов.

Багато з постачальників на перше місце виносить не об’єм словника, а зручність його використання. Дуже корисна, наприклад, така функція, як “інтелектуальний” пошук слова, тобто пошук за кількома буквами. Стандартною функцією електронних словників є тематичний розмовник. Багато з моделей об’єднані з записними книжками, об’єм пам’яті котрих може доходити до 128 Кб. Корисна можливість обміну даними з персональним комп’ютером за допомогою декотрих моделей. Ця можливість використовується в основному для резервного збереження даних, занесених в словник користувача і в записну книжку. Модель Quasar KTR 128-10 має для цього інфрачервоний порт.

Типовим є використання електронних словників в якості засобів вивчення мови. У пам’яті багатьох словників міститься ряд граматичних правил, які можна переглядати на екрані.

У деяких моделях реалізована електронна версія екзамену TOEFL з англійської мови, складання його необхідне, щоб вступити до університетів США. Багато моделей можуть синтезованим голосом передавати окремі слова і фрази (так звані “розмовляючі”). Загалом, існують два режими такої “розмови” – людська мова (вимовляння раніше вивчених слів) і синтез мови. В цьому режимі можна задавати темп і ритм голосу.

Електронні словники можуть містити в собі і освітні ігри. Це, наприклад, гра Hagman, в основі якої розгадування слів по літерам (схоже на “Поле чудес”).

Citizen. На українському ринкові присутня єдина модель – Citizen EDT-680, але відома вона досить давно. Вона дозволяє працювати з шістьма мовами: російською, англійською, німецькою, французькою, італійською, іспанською. Слід, щоправда, відмітити, що словник в основному двомовний (російсько-англійський і англо-російський), інші мови присутні тільки в тематичному розмовнику. Кожна лексична одиниця являє собою словарну статтю, як в звичайному книжковому словнику, причому присутня транскрипція, опис відповідних значень і ілюстровані приклади. Модель має повноцінну записну книжку об’ємом пам’яті 128 Кб.

Language Teacher. Моделі Language Teacher виробляє американська фірма ECTACO, що спеціалізується саме на цій продукції. Фірма виробляє англомовні словники з перекладом на одну з 16 світових мов: арабську, болгарську, угорську, в’єтнамську, грецьку, іврит, іспанську, китайську, німецьку, польську, португальську, російську, сербо-хорватську, турецьку, французьку, чеську. Політика ECTACO орієнтована на підтримку однакового рівня цін на свою продукцію в усіх країнах.

В частині моделей Language Teacher закладений ряд граматичних правил; до таких моделей додається підручник граматики, написаний професором М. Сухановим.

Електронні словники Language Teacher в Україні в основному двомовні (російсько-англійські). Вони перекладають як з російської на англійську, так і навпаки. Нещодавно з’явились моделі німецько-англо-російські ECR-5300 і ECR-3300.

Модель ER-96ir визначається як “шкільна”. Наявність букви “Т” у маркіровці моделей Language Teacher означає можливість вимовляння слів.

Інші моделі. Окрім перерахованих, на український ринок просуваються й інші моделі електронних словників, як двомовні, так і багатомовні. Відомі, наприклад, моделі Forum, Quasar, “Словотрон” і Mini Language Translator, більш відома як Vector. Mini Language Translator передбачає можливість роботи з вісьмома мовами (англійська, французька, німецька, іспанська, італійська, португальська, польська, російська), але на кожну мову припадає всього 6-7 тис. слів. Цікаво, що одні моделі Mini Language Translator маркіруються як Vector, а інші – як Quasar.

Quasar KTR-128-10 мають більше можливостей, зокрема інфрачервоний порт і повноцінну записну книжку. Ця модель дозволяє працювати з 10 мовами – до перерахованого раніше списку додаються датська і турецька мова.

За деякими даними, канали потрапляння згаданих моделей в Україну ввозяться через Росію. Складається враження, що постачальники з Росії користуються принципом: “Якщо я розкажу, де їх беру – завтра цим скористуються всі бажаючі”. Звісно, все це впливає на можливості нашого вибору у кількості, але головне, щоб якість тих, що вже є, не підвела. (1998 р.)

1 Інтерфейс – програмне середовище для спілкування користувача і машини. Інтерфейс може бути графічним, голосовим або функціонувати, використовуючи інші властивості людських органів сприйняття.


2 Див. Враження користувачів Інтернету від спілкування з Анановою.



3 Тут необхідно внести деякі пояснення. Навіть найсучасніша та найінтелектуальніша пошукова система потребує контролю з боку людини – особи, що замовила пошук, або технічного працівника, якій слідкує за ефективністю роботи системи. Як правило, автоматичний пошук інформації базується на тому, чи присутня у кожному окремому документі конкретна семантична одиниця (ключове слово), графічний об’єкт, таблиця даних, певна цифра або дата, яку, власне, шукають. При розташуванні знайдених документів за значущістю система може оперувати різними критеріями: релевантністю – кількістю повторень ключового слова у документі, “свіжістю” – датою створення чи поновлення документу, місцезнаходженням – місцем, де зберігався документ – на окремій електронній сторінці, присвяченій шуканій темі, або у загальній базі даних служби новин, чи то в архіві. Одночасно, кількість повторень окремого слова у конкретному документі не завжди пропорційна його значущості. Якщо користувачеві потрібна аналітична інформація або коментар, автоматичний пошук мало чим стане у пригоді, оскільки аналітичні статті чи відеосюжети не мають специфічних ознак “аналітичності”. Адже ключове слово “аналіз” чи “дослідження” зустрічається далеко не в кожному матеріалі. Для ефективнішої та швидшої роботи з подібними матеріалами, пошукові роботи мають набути розвиненого штучного інтелекту (так званої “неполярної” логіки). Очікується, що це стане можливим через півтора-два роки.


4 Тобто обрати з переліку тем саме ту, яка цікавить, або, якщо її немає у переліку, замовити пошук у спеціальному полі.



5 Власне, технології декодування людської мови машиною, хоча й не з дешевих, відомі вже досить давно, і застосовуються майже усюди – у навігаційних автомобільних системах, допомагають інвалідам у набиранні текстів на комп’ютері тощо. Але, беручи до уваги відносно низьку якість каналів зв’язку (особливо на теренах СНД), голосове спілкування із Анановою, сервер якої знаходиться за тисячі кілометрів від комп’ютера, практично неможливе.

6 Браузер (англ.) – програма, що дозволяє користуватися Інтернетом. Звичайно має вигляд вікна, яке, у свою чергу, може бути поділене на ще менші вікна, в яких відображається Інтернет-сторінка.


7 При роботі в Інтернет використовуються телефонні лінії зв’язку. Вони не розраховані на трансляцію великих масивів даних, а тим більше відео, яке “з’їдає” величезні дискові простори. Для зменшення навантаження на лінії, сюжети доводиться розбивати на окремі шматки довжиною від долі до кількох секунд. Ці відрізки можуть затримуватися “у дорозі” і втрачати один одного, через це і виникає так звана “гикавка” диктора. Такі проблеми особливо характерні для України, де швидкість мережевого з”єднання надзвичайно нестабільна.