Лекція 1 "введення у дисципліну"

Вид материалаЛекція

Содержание


" Автоматизоване введення текстової інформації "
Растрова графіка
Принцип дії сканера.
Характеристики сканера.
Кількість градацій яскравості
Розміри графічних файлів
Подобный материал:
1   ...   5   6   7   8   9   10   11   12   ...   17

" АВТОМАТИЗОВАНЕ ВВЕДЕННЯ ТЕКСТОВОЇ ІНФОРМАЦІЇ "



РОЗГЛЯНУТІ ПИТАННЯ:

РАСТРОВА ГРАФІКА

ПРИНЦИП ДІЇ СКАНЕРА.

ХАРАКТЕРИСТИКИ СКАНЕРА.

РОЗМІРИ ГРАФІЧНИХ ФАЙЛІВ

ФОРМАТИ ГРАФІЧНИХ ФАЙЛІВ.

ТИПИ СКАНЕРІВ

ПІДКЛЮЧЕННЯ СКАНЕРА ДО КОМП'ЮТЕРА

НЕОБХІДНІСТЬ ПЕРЕТВОРЕННЯ ГРАФІЧНИХ ТЕКСТІВ

ПРОГРАМИ РОЗПІЗНАВАННЯ ТЕКСТІВ

ПРОГРАМА FINEREADER

ПОРЯДОК РОЗПІЗНАВАННЯ ТЕКСТОВИХ ДОКУМЕНТІВ

ВІКНО ПРОГРАМИ

СКАНУВАННЯ ДОКУМЕНТА

СЕГМЕНТАЦІЯ ДОКУМЕНТА

РОЗПІЗНАВАННЯ ТЕКСТУ ДОКУМЕНТА.

НАСТРОЮВАННЯ ПРОГРАМИ FINEREADER


Розглянемо технічні і програмні засоби, що дозволяють автоматизувати процес введення текстової інформації з паперових носіїв - книг, журналів, газет, анкет і т.п. До технічних засобів належать різноманітні типи сканерів. Програмні засоби представляє система розпізнавання текстів - FineReader.

РАСТРОВА ГРАФІКА


Растрова графіка застосовується для представлення кольорових і чорно-білих ілюстрацій у газетах, журналах й інших друкарських виданнях. Зображення, у яких яскравість плавно змінюється у визначених межах, називаються напівтоновими. Як же передати зміни яскравості за допомогою фарби одного тону? Зображення представляють у виді сукупності точок різного розміру. Відстань між центрами точок залишається постійною, а розміри точок змінюються, причому більш значні точки створюють враження чорного кольору, а точки з меншими розмірами роблять зображення більш світлим. На віддаленні від малюнка точки зливаються і створюють імітацію відтінків. Таке зображення називається растровим. Якість зображення залежить від відстані між точками і вимірюється кількістю точок на одиницю довжини (як правило, на дюйм). Для газетних фотографій цей показник складає 65 точок на дюйм, для журналу з гарною якістю ілюстративного матеріалу - 150 точок на дюйм.

Растр кольорового напівтонового зображення складається з кольорових точок, причому кожна кольорова точка утворюється з трьох точок червоного, синього і зеленого кольору.

Для представлення малюнка в комп'ютері, необхідно одержати його растр і записати на магнітний носій у певному порядку яскравості кожної точки. У більшості випадків ці операції виконуються за допомогою сканера.


ПРИНЦИП ДІЇ СКАНЕРА.


Сканер - це електронно-механічний пристрій, призначений для перетворення паперового документа в електронну форму. Головка, що зчитує, рухаючись поперек листа з малюнком, рядок за рядком променем світла сканує поверхню документа. Світлочутливий датчик із визначеною частотою здійснює виміри інтенсивності відбитого оригіналом світла. Електронна схема перетворить величину, що зміряли, у двоїчний код. Таким чином, у результаті сканування документа створюється графічний файл, у якому зберігається растрове зображення вихідного документа.

ХАРАКТЕРИСТИКИ СКАНЕРА.


Розрішаюча спроможність характеризує спроможність сканера розрізняти дрібні деталі зображення. Як видно з малюнка, розрішаюча спроможність залежить як від діаметра сфокусованого променя, так і від частоти вимірів відбитого сигналу. Якщо діаметр променя дорівнює відстані між точками, то на виході сканера вони зливаються в одну, тобто не розрізняються. У якості міри розрішаючої спроможності служить кількість точок, які розрізняються сканером, що містяться на одиниці довжини - dpi (dots per inch -точок на дюйм).

Для сучасних сканерів розрішаюча спроможність складає 800 - 1200 dpi.

Кількість градацій яскравості характеризує спроможність сканера передавати перепади яскравості зображення. Яскравість зображення вимірюється рівнем нейтрального кольору (сірого). При нульовій яскравості - об'єкт чорний. Зі збільшенням яскравості колір наближається до білого.

Кожний елемент зображення має відтінок сірого кольору, що кодується двоїчним числом. У растровому зображенні число відтінків сірого залежить від використовуваного числа розрядів двоїчного числа. За допомогою однорозрядного двоїчного числа можна представити всього два рівні - 0 і 1, двохрозрядного - 4 рівня (00, 01, 10, 11), k-розрядного - 2 у ступені k рівнів. Чим більше розрядів, тим більш природними і плавними стають переходи між ділянками зображення. Людське око не в змозі розрізнити більш 256 відтінків сірого. Для 256 рівнів потрібно 8 біт, тобто 1 байт пам'яті на кожну точку растра. При використанні всіх 256 рівнів шкали яскравості процес сканування фотографії 8 на 10 см потребує 2 Мбайт дискової пам'яті. Робота з файлами такого розміру потребує великого об"єму ОЗП і потужного процесора.

Зменшення числа градацій сірого дозволяє зменшити розмір електронного зображення за рахунок деякого погіршення його якості.

Сканери дозволяють вибирати число градацій сірого. Вибір варіанта сканування визначається компромісом між якістю зображення і наявними ресурсами.

РОЗМІРИ ГРАФІЧНИХ ФАЙЛІВ


Розмір файла визначається кількістю точок растра, що представляють зображення, і залежить як від розмірів зображення (W, H), так і від розрішаючої спроможності сканера (R) і кількості рівнів квантування (N). Розрахуємо для приклада розмір файла зображення отриманого при скануванні чорно-білої фотографії розміром W=8 на H=10 см. Розрішаюча спроможність сканера R=400 точок на дюйм. Перекладемо цей розмір метричну систему мір. Тому що 1 дюйм=25.4 мм, те R=400/25.4=16 точок на мм. Для представлення одного рядка фотографії потрібно в 80(мм)*16(т/мм)=1280 точок. Усього рядків 100(мм)*16(т/мм)=1600. Таким чином, растр фотографії складається з 1280*1600=2048000 точок.

Якщо взяти максимальну кількість рівнів квантування N=256, то одна точка кодується 8 розрядним числом - 1 байтом. Звідси випливає, що розмір графічного файла - 2048000(точок)*1(байт)=2000 Кбайт. Тобто близько 2 Мбайт.

Для штрихового малюнка не потрібна передача напівтонів, кількість рівнів квантування можна взяти рівною 2 і представляти точку 1-розрядним числом. У цьому випадку розмір файла зменшиться в 8 разів і складе 250 Кбайт.

Розмір кольорової фотографії за інших рівних умов буде в три рази більше і складає близько 6 Мбайт.