Ввод стандартных форм и форматированных документов

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

МИНИСТЕРСТВО КУЛЬТУРЫ И ТУРИЗМА УКРАИНЫ

ХАРЬКОВСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ КУЛЬТУРЫ

 

Кафедра информационных технологий

 

 

 

 

 

 

Курсовая работа по дисциплине Электронный документооборот

ВВОД СТАНДАРТНЫХ ФОРМ И ФОРМАТИРОВАННЫХ ДОКУМЕНТОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Харьков-2009

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ

РАЗДЕЛ 1 СТАНДАРТНЫЕ ФОРМЫ И ИХ КЛАССИФИКАЦИЯ

1.1 Понятие и признаки классификации стандартных форм

1.2 Типы стандартных форм в зависимости от применения

Выводы к разделу 1

РАЗДЕЛ 2 ВВОД И ОБРАБОТКА СТАНДАРТНЫХ ФОРМ

2.1 Этапы ввода и обработки форматированных документов

2.2 Основные принципы потокового ввода форм

2.3Требования к системам массового ввода стандартных форм

2.4 Подходы к реализации систем обработки форм

Выводы к разделу 2

РАЗДЕЛ 3 СИСТЕМЫ МАССОВОГО ВВОДА СТАНДАРТНЫХ ФОРМ

3.1 Система ABBYY Fine Reader Form

3.2 Система Cognitive Forms

Выводы к разделу 3

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

 

ВВЕДЕНИЕ

 

В последнее время проблема массового ввода данных стала особо актуальной. Число документов постоянно растёт, а вместе с ними увеличиваются проблемы по вводу и обработке больших объёмов данных в вычислительных системах. Необходимость обработки структурированных и неструктурированных форм документов, изначально выполненных на бумаге, возникает в деятельности большого количества государственных, акционерных и частных предприятий. Стало очевидно, что для организации управления и контроля необходимо, чтобы любая информационная единица, порожденная на уровне отдельного гражданина или отдельного предприятия, сразу оказалась в информационной системе и была доступна в любой момент для анализа и обобщения. По мировой статистике приблизительно 80% всех документов, используемых в бизнесе, составляют формы. Они возникают практически в любом бизнесе, связанном с обслуживанием клиентов, а также в деятельности государственных органов, занятых сбором данных о физических и юридических лицах. Таким образом, существует необходимость автоматизации и повсеместного внедрения систем массового ввода форм, что существенно облегчит их обработку. Как следствие, повысится производительность и эффективность работы предприятий и организаций вцелом.

Объектом исследования являются стандартные формы.

Предмет исследования ввод стандартных форм и форматированных документов.

Цель исследования рассмотрение принципов ввода и обработки стандартных форм.

Задачи исследования:

  1. Проанализировать основную литературу по теме курсовой работы.
  2. Определить понятие и классификацию стандартных форм.
  3. Рассмотреть основные этапы ввода и обработки форматированных документов.
  4. Установить основные требования к системам массового ввода форм.
  5. Рассмотреть системы массового ввода форм, разработанные различными фирмами.

Методика исследования системный анализ литературных источников и Интернет сайтов.

Основные работы, посвящённые данной теме это источники 1, 3, 4, 10, 11, 13. Сущность понятия стандартная форма изложено в источниках 10, 13. В источнике 1 описаны признаки стандартных форм, положенные в основу их классификации. Применение стандартных форм и их типология, в зависимости от применения в той или иной области управления, приведено в источниках 1, 7, 8, 11. Этапы ввода и обработки форматированных документов рассмотрены в источниках 1, 2, 10, 11, 13. Более подробно этап сканирования изложен в источнике 1, сегментация и технологии распознавания в источниках 1, 10, 11. Принципы потокового ввода стандартных форм освящены в источнике 3. Требования к системам массового ввода и обработки стандартных форм, а также подходы к их реализации рассмотрены в источниках 1, 2, 11. Компании, предлагающие решения по разработке систем массового ввода стандартных форм и спешность их разработок описаны в источниках 3-6, 10, 11, 13-15.

Тема достаточно полно освящена на сайтах Интернет, книг и статей по данной теме очень мало.

 

1 СТАНДАРТНЫЕ ФОРМЫ И ИХ КЛАССИФИКАЦИЯ

 

1.1 Понятие и признаки классификации стандартных форм

 

Стандартные формы однотипные документы, используемые главным образом в крупных организациях, связанных с массовым обслуживанием клиентов. Для удобства их обработки, информация, содержащая ответ на один и тот же вопрос, в разных документах заносится в фиксированное по отношению к границам документа поле.

Основные отличия стандартной формы это одинаковый размер документов и фиксированное положение линий разграфки [10].

На Западе вместо понятия система обработки форм используется термин Document Capturing (т.е. захват документа). В общем приближении рынок Document Capturing (только его программная часть) в мире оценивается примерно в 300 млн. долл., при этом довольно быстро развиваясь.

Сущность системы обработки форм сводится к распознаванию документа определенного формата в общем случае с печатным или рукопечатным заполнением. Задача распознавания состоит в нахождении неких известных полей, а результатом работы программы обычно является не просто текстовый документ, а определенная запись в некоторой базе данных [13].

Основой классификации стандартных форм могут служить следующие признаки:

1 признак способ нанесе?/p>