Автоматизация работы в офисе

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

?.

2.6. Особенности настройки программы FineReader

Как и большинство других приложений Windows, программу FineReader можно настроить в соответствии с требованиями конкретного пользователя. Все настройки осуществляются при помощи диалогового окна Опции, которое открывают с помощью любой раскрывающей стрелки на панели инструментов Scan&Read или через меню Сервис. Если использована панель инструментов, то диалоговое окно открывается на вкладке, соответствующей использованной кнопке панели инструментов.

Вкладка Сканирование служит для выбора и настройки сканера, а также для определения способа доступа к нему.

Вкладка Сегментация позволяет настраивать некоторые параметры для автоматической сегментации. Здесь задают параметры автоматического разбиения таблиц и настраивают режим автоматической сегментации многоколоночного текста.

Средства вкладки Форматирование позволяют задать способ форматирования распознанной страницы и выбрать используемые шрифты.

Вкладка Распознавание определяет параметры распознавания документа. Она позволяет задать язык документа и особенности исходного шрифта, а также настроить режим распознавания с обучением. Здесь же задается метод цветового выделения ненадежно распознанных символов.

Элементами управления вкладки Проверка задают метод проверки орфографии и способ пометки обнаруженных ошибок или сомнительных мест.

Вкладка Установки определяет общие настройки программы. Здесь задают язык интерфейса и настраивают используемые единицы измерения.

Флажки панели Показывать определяют способ представления окна программы и открытых документов.

Панель Цвета позволяет определить цвета различных элементов документа. В нижней части окна можно задать дополнительные параметры.

2.7. Распознавание бланков

Важной особенностью программы FineReader является возможность распознавания бланков. Бланк представляет собой отформатированный документ, в специальные поля которого вносятся данные. Типичными примерами бланков являются анкеты. Формат бланка может быть достаточно вычурным и не напоминать ни книжную, ни журнальную страницу.

Особенность работы с бланками заключается в том, что приходится иметь дело с объемным пакетом документов одинаковою формата, заполненных разными людьми. В таких документах различается содержание заполненных полей, а стандартные заголовки не представляют интереса. Данные, полученные из набора бланков, обычно подлежат последующей обработке, например статистической. Для обработки бланков предназначено специальное приложение FineReader Forms.

Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для этого служит команда СервисШаблоны. В открывшемся диалоговом окне Шаблоны можно создать новый шаблон или открыть для редактирования уже имеющийся.

В этом случае программа открывает окно Редактор шаблонов и дополнительное диалоговое окно Параметры. В этом окне размещают блоки, соответствующие полям бланка и для каждого блока указывают тип содержащегося в нем значения. Блоки, содержащие данные, задаваемые пользователем, помечаются как экспортируемые. Данные могут записываться в текстовый файл или заноситься в базу данных в качестве записей.

Созданный шаблон используется на этапе сегментации. Сегментация в данном случае состоит не в реальном разбиении страницы на блоки, а в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещен бланк при сканировании.

Заключительный этап состоит в распознавании содержимого бланка. Результат представляется в виде формы, содержащей названия полей и их содержание. Последовательность распознанных бланков может быть сохранена в рамках единой базы данных для последующей обработки.

3. Автоматический перевод документов

Идея автоматического перевода текстов с одного языка на другой витает в воздухе со времени появления самых первых компьютеров. Если бы полноценный перевод был возможен, значительно упростилось бы общение между народами и обмен документами, но это очень сложная задача, о полном решении которой пока не приходится говорить.

Все упирается в объем переводимого текста. Компьютеризованный словарь вполне может справиться с переводом отдельных слов, особенно если он способен предложить несколько значений на выбор. Однако ситуация заметно усложняется, когда мы переходим к переводу целых фраз и, тем более, абзацев связного текста.

Для таких случаев надежного алгоритма перевода с одного языка на другой не существует. Это связано с тем, что каждая фраза языка имеет два уровня: синтаксический и смысловой. Синтаксический уровень определяет построение предложения, а смысловой его содержание. Для правильного смыслового перевода необходимо принимать во внимание не только конкретную фразу, но и абзац или даже целую главу текста. Таким образом, рассчитывать на то, что при автоматическом переводе получится полноценный документ, нельзя.

Программы автоматического перевода рассчитаны, в первую очередь, на тех, кто совсем не знает соответствующего иностранного языка, но должен ознакомиться с содержанием документа хотя бы приблизительно. Кроме того, подобные программы позволяют готовить короткие сообщения электронной почты на иностранном языке. Такие сообщения трудно считать грамотными, но, скорее всего, корреспо