Лекция 1 "введение в дисциплину"
Вид материала | Лекция |
Содержание" Автоматизированный ввод текстовой информации " Растровая графика Принцип действия сканера. Характеристики сканера. Количество градаций яркости Размеры графических файлов |
- Конспект лекций н. О. Воскресенская Москва 2008 Оглавление: Лекция Введение в дисциплину, 567.5kb.
- Текст лекций н. О. Воскресенская Оглавление Лекция 1: Введение в дисциплину. Предмет, 1185.25kb.
- Программа дисциплины «История» Введение в дисциплину «История», 288.37kb.
- Лекция Введение в дисциплину, 934.43kb.
- Содержание разделов дисциплины, объем в лекционных часах-60 часов, 48.53kb.
- Лекция Введение в дисциплину Характеристики сетей ЭВМ, 384.76kb.
- Лекция Введение в дисциплину, 100.35kb.
- Программа дисциплины «Введение в историю человечества» для направления 030600. 62 «История», 737.25kb.
- Программа дисциплины «Введение в программирование» для направления 080700 «Бизнес-информатика», 101.22kb.
- Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов, 445.52kb.
" АВТОМАТИЗИРОВАННЫЙ ВВОД ТЕКСТОВОЙ ИНФОРМАЦИИ "
РАССМАТРИВАЕМЫЕ ВОПРОСЫ:
РАСТРОВАЯ ГРАФИКА
ПРИНЦИП ДЕЙСТВИЯ СКАНЕРА.
ХАРАКТЕРИСТИКИ СКАНЕРА.
РАЗМЕРЫ ГРАФИЧЕСКИХ ФАЙЛОВ
ФОРМАТЫ ГРАФИЧЕСКИХ ФАЙЛОВ.
ТИПЫ СКАНЕРОВ
ПОДКЛЮЧЕНИЯ СКАНЕРА К КОМПЬЮТЕРУ
НЕОБХОДИМОСТЬ ПРЕОБРАЗОВАНИЯ ГРАФИЧЕСКИХ ТЕКСТОВ
ПРОГРАММЫ РАСПОЗНАВАНИЯ ТЕКСТОВ
ПРОГРАММА FINEREADER
ПОРЯДОК РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ДОКУМЕНТОВ
ОКНО ПРОГРАММЫ
СКАНИРОВАНИЕ ДОКУМЕНТА
СЕГМЕНТАЦИЯ ДОКУМЕНТА
РАСПОЗНАВАНИЕ ТЕКСТА ДОКУМЕНТА.
НАСТРОЙКА ПРОГРАММЫ FINEREADER
Рассмотрим технические и программные средства, позволяющие автоматизировать процесс ввода текстовой информации с бумажных носителей - книг, журналов, газет, анкет и т.п. К техническим средствам относятся различные типы сканеров. Программные средства представляет система распознавания текстов - FineReader.
РАСТРОВАЯ ГРАФИКА
Растровая графика применяется для представления цветных и черно-белых иллюстраций в газетах, журналах и других печатных изданиях. Изображения, у которых яркость плавно изменяется в определенных пределах, называются полутоновыми. Как же передать изменения яркости с помощью краски одного тона? Изображение представляют в виде совокупности точек разной величины. Расстояние между центрами точек остается постоянным, а размеры точек изменяются, причем более крупные точки создают впечатление черного цвета, а точки с меньшими размерами делают изображение более светлым. На удалении от рисунка точки зрительно сливаются и создают имитацию оттенков. Такое изображение называется растровым. Качество изображения зависит от расстояния между точками и измеряется количеством точек на единицу длины (как правило, на дюйм). Для газетных фотографий этот показатель составляет 65 точек на дюйм, для журнала с хорошим качеством иллюстративного материала - 150 точек на дюйм.
Растр цветного полутонового изображения состоит из цветных точек, причем каждая цветная точка получается из трех точек красного, синего и зеленого цвета.
Для представления рисунка в компьютере, необходимо получить его растр и записать на магнитный носитель в определенном порядке яркости каждой точки. В большинстве случаев эти операции выполняются с помощью сканера.
ПРИНЦИП ДЕЙСТВИЯ СКАНЕРА.
Сканер - это электронно-механическое устройство, предназначенное для преобразования бумажного документа в электронную форму. Считывающая головка, двигаясь поперек листа с рисунком, строка за строкой лучом света обозревает (сканирует) поверхность документа. Светочувствительный датчик с определенной частотой производит замеры интенсивности отраженного оригиналом света. Электронная схема преобразует измеренную величину в двоичный код. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа.
ХАРАКТЕРИСТИКИ СКАНЕРА.
Разрешающая способность характеризует способность сканера различать мелкие детали изображения. Как видно из рисунка, разрешающая способность зависит как от диаметра сфокусированного луча, так и от частоты замеров отраженного сигнала. Если диаметр луча равен расстоянию между точками, то на выходе сканера они сливаются в одну, то есть не различаются (не разрешаются). В качестве меры разрешающей способности служит количество различимых сканером точек, умещающихся на единице длины - dpi (dots per inch -точек на дюйм).
Для современных сканеров разрешающая способность составляет 800 - 1200 dpi.
Количество градаций яркости характеризует способность сканера передавать перепады яркости изображения. Яркость изображения измеряется уровнем нейтрального цвета (серого). При нулевой яркости - объект черный. С увеличением яркости цвет стремится к белому.
Каждый элемент изображения имеет оттенок серого цвета, который кодируется двоичным числом. В растровом изображении число оттенков серого зависит от используемого числа разрядов двоичного числа. С помощью одноразрядного двоичного числа можно представить всего два уровня - 0 и 1, двухразрядного - 4 уровня (00, 01, 10, 11), k-разрядного - 2 в степени k уровней. Чем больше разрядов, тем более естественными и плавными становятся переходы между участками изображения. Человеческий глаз не в состоянии различить более 256 оттенков серого. Для 256 уровней требуется 8 бит, то есть 1 байт памяти на каждую точку растра. При использовании всех 256 уровней шкалы яркости процесс сканирования фотографии 8 на 10 см требует 2 Мбайт дисковой памяти. Работа с файлами такого размера требует большого объема ОЗУ и мощного процессора.
Уменьшение числа градаций серого позволяет уменьшить размер электронного изображения за счет некоторого ухудшения его качества.
Сканеры позволяют выбирать число градаций серого. Выбор варианта сканирования определяется компромиссом между качеством изображения и имеющимися ресурсами.
РАЗМЕРЫ ГРАФИЧЕСКИХ ФАЙЛОВ
Размер файла определяется количеством точек растра, представляющих изображение, и зависит как от размеров изображения (W, H), так и от разрешающей способности сканера (R) и количества уровней квантования (N). Рассчитаем для примера размер файла изображения полученного при сканировании черно-белой фотографии размером W=8 на H=10 см. Разрешающая способность сканера R=400 точек на дюйм. Переведем эту величину метрическую систему мер. Так как 1 дюйм=25.4 мм, то R=400/25.4=16 точек на мм. Для представления одной строки фотографии требуется в 80(мм)*16(т/мм)=1280 точек. Всего строк 100(мм)*16(т/мм)=1600. Таким образом, растр фотографии состоит из 1280*1600=2048000 точек.
Если взять максимальное количество уровней квантования N=256, то одна точка кодируется 8 разрядным числом - 1 байтом. Отсюда следует, что размер графического файла - 2048000(точек)*1(байт)=2000 Кбайт. То есть около 2 Мбайт.
Для штрихового рисунка не требуется передача полутонов, количество уровней квантования можно взять равным 2 и представлять точку 1-разрядным числом. В этом случае размер файла уменьшится в 8 раз и составит 250 Кбайт.
Размер цветной фотографии при прочих равных условиях будет в три раза больше и составит около 6 Мбайт.