Лекция 1 "введение в дисциплину"

Вид материалаЛекция

Содержание


Окно программы
Инструментальные панели.
Рабочая область
Сканирование документа
Подобный материал:
1   ...   8   9   10   11   12   13   14   15   ...   18

ОКНО ПРОГРАММЫ


Окно программы имеет типичный для приложений Windows вид и содержит строку меню, инструментальные панели и рабочую область.

Меню. Меню программы FineReader содержит более 100 команд, разбитых на 8 групп. Имена этих групп составляют пункты головного меню:
  1. "Файл" - группа операций по открытию и сохранению файлов изображений, блоков и пакетов.
  2. "Правка" - самая многочисленная группа команд редактирования блоков, таблиц, текста.
  3. "Вид" - группа команд, управляющая отображением инструментальных панелей, исходных и распознанных страниц, масштабами изображений.
  4. "Изображения" - команды редактирования изображения (повороты, зеркальное отображение, инверсия).
  5. "Scan&Read" - самая главная группа команд сканирования, сегментирования и распознавания.
  6. "Сервис" - группа команд по проверке орфографии, настройке сканера и других сервисных функций.
  7. "Окно" - команды управляющие размещением окон внутри рабочей области.
  8. "Справка" - сведения о разработчиках программы и справочная система.

Инструментальные панели. Инструментальные панели содержат пиктограммы наиболее часто используемых операций. Управлять количеством отображаемых на экране панелей можно либо через головное меню "Вид-Панели инструментов", либо с помощью контекстного меню, вызываемого правой кнопкой мыши. Всего имеется 5 панелей:
  1. "Стандартная" содержит кнопки для откры­тия документов и для операций с буфером обмена.
  2. "Scan&Read " содержит кнопки, соответствующие всем этапам превращения бумажного документа в электронный текст. Первая кнопка позволяет выполнить такое преобразование в рамках единой операции. Остальные кнопки соответствуют отдельным этапам работы и содержат раскрывающиеся меню, служащие для управления соответствующей операцией.
  3. "Распознавание" позволяет указать Язык документа и вид шрифта. Последнее требуется делать только в том случае, когда документ имеет плохое качество печати.
  4. "Форматирование" используют для изменения представления готового текста или при его редактировании.
  5. "Инструменты" используют при работе с исходным изображением. В частности, она позволяет управлять сегментацией документа.

Рабочая область. Рабочая область в зависимости от этапа преобразования документа может содержать до 4 внутренних окон.
  1. Окно "Пакет" располагается в левой части рабочей области и содержит пиктограммы обрабатываемых страниц документа, которые должны быть преобразованы в текст. Форма значка, представляющего страницу, зависит от этапа обработки. По виду значка легко узнать было ли произведено сегментирование, распознавание. Щелчок мыши по пиктограмме делает страницу активной, а двойной щелчок приводит к отображению страницы в окне "Изображение"
  2. Окно "Изображение" содержит изображение отсканированного документа. С его помощью можно оценить качество сканирования.
  3. Окно "Крупный план" содержит фрагмент графического документа из окна "Изображение" в увеличенном виде. С ее помощью можно оценить качество распознавания. Эту панель используют также при «обучении» программы в ходе распознавания текста.
  4. Окно "Текст" отображает распознанную страницу.


Рассмотрим вариант обработки документа по этапам.

СКАНИРОВАНИЕ ДОКУМЕНТА


Сканирование — это техническая операция, которую выполняет сканирующее устройство. Задача программы FineReader на этом этапе состоит в том, чтобы принять полученную информацию от сканера и отобразить значки отсканированных страниц на панели Пакет.

Для того чтобы провести сканирование необходимо:
  1. Запустить программу FineReader и включить сканер.
  2. Выбрать тип драйвера (драйвера сканера, TWAIN-драйвера). При непосредственном взаи­модействии со сканером возможность сканирования цветных изображений не используется, так как предполагается, текст в любом случае является одноцветным. Установить флажки и параметры режима сканирования:
  • ориентация (книжная, альбомная),
  • подбор яркости (ручной, автоматический),
  • режим сканирования картинок ()
  • разрешение,
  • флажок "Показывать диалог перед сканированием" при­меняют только в том случае, когда бумажные страницы доку­мента существенно отличаются друг от друга. Это может быть вызвано, например, свойствами бумаги или тем, что разные страницы печатались в разное время и разными средствами. В этом случае перед сканированием каждой страницы откры­вается диалоговое окно настройки сканера, чтобы пользова­тель мог отрегулировать качество процесса.
  • флажок "Пауза между страницами, сек" используют при отсутствии у сканера автоматической подачи страниц.

Окно диалога TWAIN-драйвера появляется после запуска процесса сканирования.
  1. Сканирование страницы производится по щелчку на кнопке "Сканировать" на панели инструментов Scan&Read или при нажатии комбинации клавиш CTRL+K.

На кнопке появляется красный кружок с белым крестиком, сигнализирующий о том, что процесс сканирования начался. Прервать процесс можно только клавишей Esc. Если требуется обработать много страниц, то лучше всего сначала все их отсканировать, а уже затем приступать к распознаванию. Это связано с тем, что сканирование требует присутствия пользо­вателя из-за необходимости управления сканером (например, для смены страниц), а распознавание может происходить в автомати­ческом режиме.

После сканирования каждого листа в окне "Пакет" появляется пиктограмма с номером страницы. Страницы нумеруются последовательно, начиная с единицы. Существует опция, позволяющая нумеровать с заданной страницы, с заданным приращением 1 или 2, по возрастанию или убыванию.

Когда последняя страница будет отсканирована, открываются два окна - "Изображение" и "Крупный план", в которых отображена активная страница. Пользователь может просмотреть результаты сканирования в разных масштабах, узнать свойства изображения, сохранить полученные графические файлы в отдельной папке.