Лекция 1 "введение в дисциплину"

Вид материалаЛекция

Содержание


" Автоматизированный ввод текстовой информации "
Растровая графика
Принцип действия сканера.
Характеристики сканера.
Количество градаций яркости
Размеры графических файлов
Подобный материал:
1   ...   5   6   7   8   9   10   11   12   ...   18

" АВТОМАТИЗИРОВАННЫЙ ВВОД ТЕКСТОВОЙ ИНФОРМАЦИИ "



РАССМАТРИВАЕМЫЕ ВОПРОСЫ:

РАСТРОВАЯ ГРАФИКА

ПРИНЦИП ДЕЙСТВИЯ СКАНЕРА.

ХАРАКТЕРИСТИКИ СКАНЕРА.

РАЗМЕРЫ ГРАФИЧЕСКИХ ФАЙЛОВ

ФОРМАТЫ ГРАФИЧЕСКИХ ФАЙЛОВ.

ТИПЫ СКАНЕРОВ

ПОДКЛЮЧЕНИЯ СКАНЕРА К КОМПЬЮТЕРУ

НЕОБХОДИМОСТЬ ПРЕОБРАЗОВАНИЯ ГРАФИЧЕСКИХ ТЕКСТОВ

ПРОГРАММЫ РАСПОЗНАВАНИЯ ТЕКСТОВ

ПРОГРАММА FINEREADER

ПОРЯДОК РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ДОКУМЕНТОВ

ОКНО ПРОГРАММЫ

СКАНИРОВАНИЕ ДОКУМЕНТА

СЕГМЕНТАЦИЯ ДОКУМЕНТА

РАСПОЗНАВАНИЕ ТЕКСТА ДОКУМЕНТА.

НАСТРОЙКА ПРОГРАММЫ FINEREADER


Рассмотрим технические и программные средства, позволяющие автоматизировать процесс ввода текстовой информации с бумажных носителей - книг, журналов, газет, анкет и т.п. К техническим средствам относятся различные типы сканеров. Программные средства представляет система распознавания текстов - FineReader.

РАСТРОВАЯ ГРАФИКА


Растровая графика применяется для представления цветных и черно-белых иллюстраций в газетах, журналах и других печатных изданиях. Изображения, у которых яркость плавно изменяется в определенных пределах, называются полутоновыми. Как же передать изменения яркости с помощью краски одного тона? Изображение представляют в виде совокупности точек разной величины. Расстояние между центрами точек остается постоянным, а размеры точек изменяются, причем более крупные точки создают впечатление черного цвета, а точки с меньшими размерами делают изображение более светлым. На удалении от рисунка точки зрительно сливаются и создают имитацию оттенков. Такое изображение называется растровым. Качество изображения зависит от расстояния между точками и измеряется количеством точек на единицу длины (как правило, на дюйм). Для газетных фотографий этот показатель составляет 65 точек на дюйм, для журнала с хорошим качеством иллюстративного материала - 150 точек на дюйм.

Растр цветного полутонового изображения состоит из цветных точек, причем каждая цветная точка получается из трех точек красного, синего и зеленого цвета.

Для представления рисунка в компьютере, необходимо получить его растр и записать на магнитный носитель в определенном порядке яркости каждой точки. В большинстве случаев эти операции выполняются с помощью сканера.


ПРИНЦИП ДЕЙСТВИЯ СКАНЕРА.


Сканер - это электронно-механическое устройство, предназначенное для преобразования бумажного документа в электронную форму. Считывающая головка, двигаясь поперек листа с рисунком, строка за строкой лучом света обозревает (сканирует) поверхность документа. Светочувствительный датчик с определенной частотой производит замеры интенсивности отраженного оригиналом света. Электронная схема преобразует измеренную величину в двоичный код. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа.

ХАРАКТЕРИСТИКИ СКАНЕРА.


Разрешающая способность характеризует способность сканера различать мелкие детали изображения. Как видно из рисунка, разрешающая способность зависит как от диаметра сфокусированного луча, так и от частоты замеров отраженного сигнала. Если диаметр луча равен расстоянию между точками, то на выходе сканера они сливаются в одну, то есть не различаются (не разрешаются). В качестве меры разрешающей способности служит количество различимых сканером точек, умещающихся на единице длины - dpi (dots per inch -точек на дюйм).

Для современных сканеров разрешающая способность составляет 800 - 1200 dpi.

Количество градаций яркости характеризует способность сканера передавать перепады яркости изображения. Яркость изображения измеряется уровнем нейтрального цвета (серого). При нулевой яркости - объект черный. С увеличением яркости цвет стремится к белому.

Каждый элемент изображения имеет оттенок серого цвета, который кодируется двоичным числом. В растровом изображении число оттенков серого зависит от используемого числа разрядов двоичного числа. С помощью одноразрядного двоичного числа можно представить всего два уровня - 0 и 1, двухразрядного - 4 уровня (00, 01, 10, 11), k-разрядного - 2 в степени k уровней. Чем больше разрядов, тем более естественными и плавными становятся переходы между участками изображения. Человеческий глаз не в состоянии различить более 256 оттенков серого. Для 256 уровней требуется 8 бит, то есть 1 байт памяти на каждую точку растра. При использовании всех 256 уровней шкалы яркости процесс сканирования фотографии 8 на 10 см требует 2 Мбайт дисковой памяти. Работа с файлами такого размера требует большого объема ОЗУ и мощного процессора.

Уменьшение числа градаций серого позволяет уменьшить размер электронного изображения за счет некоторого ухудшения его качества.

Сканеры позволяют выбирать число градаций серого. Выбор варианта сканирования определяется компромиссом между качеством изображения и имеющимися ресурсами.

РАЗМЕРЫ ГРАФИЧЕСКИХ ФАЙЛОВ


Размер файла определяется количеством точек растра, представляющих изображение, и зависит как от раз­меров изображения (W, H), так и от разрешающей способности сканера (R) и количества уровней квантования (N). Рассчитаем для примера размер файла изображения полученного при сканировании черно-белой фотографии размером W=8 на H=10 см. Разрешающая способность сканера R=400 точек на дюйм. Переведем эту величину метрическую систему мер. Так как 1 дюйм=25.4 мм, то R=400/25.4=16 точек на мм. Для представления одной строки фотографии требуется в 80(мм)*16(т/мм)=1280 точек. Всего строк 100(мм)*16(т/мм)=1600. Таким образом, растр фотографии состоит из 1280*1600=2048000 точек.

Если взять максимальное количество уровней квантования N=256, то одна точка кодируется 8 разрядным числом - 1 байтом. Отсюда следует, что размер графического файла - 2048000(точек)*1(байт)=2000 Кбайт. То есть около 2 Мбайт.

Для штрихового рисунка не требуется передача полутонов, количество уровней квантования можно взять равным 2 и представлять точку 1-разрядным числом. В этом случае размер файла уменьшится в 8 раз и составит 250 Кбайт.

Размер цветной фотографии при прочих равных условиях будет в три раза больше и составит около 6 Мбайт.