Ввод стандартных форм и форматированных документов

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

мы в базу данных, включает несколько этапов: подготовка обработки формы, сканирование, сегментация полученного изображения, распознавание значимых полей, верификация, сохранение данных в полях базы данных. Причём сегментацию изображения формы и извлечение данных из значимых полей подразумевает обработка форм.

При вводе форм целесообразно придерживаться определённых принципов, брать во внимание основные требования, предъявляемые к системам массового ввода форм и учитывать подходы к их реализации. Это обеспечит реальную экономию, снизит количество опечаток, повысит точность и соответственно достоверность вводимых данных, а также освободит сотни людей от неэффективного утомительного труда.

 

3 СИСТЕМЫ МАССОВОГО ВВОДА СТАНДАРТНЫХ ФОРМ

 

Существует несколько сотен компаний, которые предлагают решения или компоненты систем обработки форм по всему миру. Выбор решения, наиболее соответствующего потребностям заказчика и являющегося оптимальным по стоимости, непростая задача. Выбирая систему обработки форм, следует ориентироваться на особенности организации и виды преобладающих в ней форм.

Больших успехов в разработке систем массового ввода и распознавания форм достигли наши отечественные компании. Наиболее известными системами ввода форм являются системы ABBYY Fine Reader Form и Cognitive Forms.

 

3.1 Система ABBYY Fine Reader Form

 

Система Fine Reader Form предназначена для автоматического ввода данных из стандартных форм и форматированных документов в информационные системы и базы данных.

Преимущества системы:

  • Реализация пилотного проекта и принятие решения о внедрении по его результатам.
  • Лёгкость настройки на любые виды форм как структурированные, так и гибкие.
  • Уменьшение времени на ввод данных с бумажных форм в 10 раз.
  • Повышение точности итоговых данных благодаря поддержке технологий OCR, ICR, OMR и технологии распознавания штрихкодов.
  • Быстрая окупаемость системы благодаря разумной стоимости и низким затратам на внедрение.

Семейство ABBYY Form Reader 6.5 включает в себя:

  • простую во внедрении и изучении систему ABBYY Form Reader 6.5 Desktop Edition для использования на локальной рабочей станции.
  • распределённое и легко масштабируемое решение ABBYY Form Reader 6.5 Enterprise Edition для потокового ввода больших объёмов данных;
  • средство разработки ABBYY Form Reader 6.5 Developer Edition для интеграции функций Form Reader во внешние приложения;
  • инструментарий ABBYY Flexi Capture Studio 1.5 для создания на базе ABBYY Form Reader с технологией ABBYY Flexi Capture решений для обработки гибких форм и документов.

ABBYY Form Reader успешно используют банки, страховые компании, маркетинговые агентства и производственные компании, государственные учреждения и учебные заведения, торговые компании и медицинские организации.

ABBYY Form Reader способен обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости, автоматически сортирует бланки, проверяет комплектацию многостраничных форм, не требует вмешательства оператора на этапах сканирования и распознавания.

Система предполагает автоматический контроль результатов распознавания с помощью перекрёстных проверок, правил контроля сумм, сверок по словарям и базам данных. Существует возможность создать собственные правила проверки, в том числе с подключением списков и словарей, и использовать их для контроля качества вводимых данных.

Использование локальной версии ABBYY Form Reader позволяет силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации. Если объём работ по вводу данных увеличится, пользователь в течение дня сможет модифицировать существующий комплекс, перейдя на версию с большей производительностью. Чтобы увеличить скорость обработки форм на 1000 страниц в день, достаточно установить Form Reader на еще одно рабочее место [3,4,12].

Fine Reader Bank система автоматизированного ввода платежных поручений также является продуктом разработки компании ABBYY. Fine Reader Bank готовое приложение, в основе которого лежит технология распознавания гибких форм [5,6].

 

3.2 Система Cognitive Forms

 

Компания Cognitive Technologies разработала систему для ввода и обработки форм Cognitive Forms. Процесс её работы осуществляется следующим образом.

Оператор на станции сканирования помещает пачку документов в устройство автоматической подачи сканера. Нажатием клавиши запускается процесс потокового сканирования документов.

Подсистема распознавания Cognitive Form-Reader в автоматическом режиме управляет распознаванием и контекстной проверкой правильности распознавания.

На станции визуального контроля (модуль редактирования Cognitive Form Editor) оператор имеет возможность визуально контролировать и редактировать распознанные поля форм перед экспортом в базу данных.

В подсистеме описания форм (Cognitive Form Designer) производится компьютерное описание обрабатываемых форм, используемое на всех этапах процесса ввода от распознавания до экспорта в базу данных.

Подсистема экспорта результатов формирует текстовое представление документа перед его записью в базу данных, с окончательной проверкой на допустимость значений экспортируемых данных. Регистрация записи осуществляется пользователем после ввода и проверки определенного количества документов.

Одним из важных элементов Cognitive Forms является система контроля за правильностью ввода информации. Ее основная функция состоит в том, чтобы точность распознавания на выходе с?/p>