Кодування інформації

Вид материалаДокументы

Содержание


Збирання інформації
Опрацювання інформації
Нагромадження інформації
Зберігання інформації
Пошук інформації
Подобный материал:
Кодування інформації

Вибір того чи іншого способу подання інформації означає вибір певної мови.

Мовою називається система знаків та правил, яка забезпечує спілку­вання, а також відображення, опис та передавання інформації. Таким чи­ном, можна говорити про мову міміки, жестів, розмовну мову, мову умов­них знаків тощо.

Розрізняють мови природні та штучні. Кількість природних мов та діале­ктів, які існують в світі, становить близько 10 000. Природні мови утворили­ся в процесі формування людського суспільства і продовжують розвиватися.

Штучні мови призначаються для окремих галузей діяльності людини. Так, наприклад, у навчанні математики використовується мова математичної символіки, а для розв'язування задач на комп'ютері — мова програмування. Характерною особливістю штучних мов є формалізованість, точна визначе­ність правил мови, без знання яких її використання неможливе. Штучні мови створюються в результаті діяльності відповідних фахівців. Так, в істо­рії математики простежується довгий шлях формування звичних для нас математичних позначень. Історія мов програмування значно коротша: вона бере свій початок із середини минулого століття. Проте сьогодні існують тисячі мов спілкування з комп'ютером, і це відбиває різноплановість задач, для розв'язання яких він застосовується.

Основу будь-якої мови складає її алфавіт.

Алфавітом називається упорядкована сукупність усіх різних знаків мови. Слово «алфавіт» походить від грецького alphabetos, тобто від назв перших двох літер грецької абетки — alpha та beta. Кількість знаків, з яких складається алфавіт, іноді називають його потужністю. Кожному знакові алфавіту надається певний смисл.

У процесі передавання чи зберігання інформації часто доводиться переходити від одного способу подання інформації до іншого, тобто з однієї мови на іншу. Наприклад, при написанні телеграми виникає ряд перетворень:

усний текст — письмовий текст — електричні сигнали - письмовий текст. Усі перетворення усно складеного тексту були формальними, вони відбува­лися на рівні знаків алфавіту за певними правилами.

" Перетворення символів одного алфавіту на символи іншого алфавіту за певними правилами називається кодуванням (від латинського слова codex -звід законів), а результат цього перетворення - кодом.

Хоча кодування й нагадує перекладання з однієї мови на іншу, проте це не так Якщо йдеться про переклад, то передається смислове значення текс­ту і при кодуванні відбувається формальна заміна: знакові одного алфавіту за певним правилом ставиться у відповідність знак іншого алфавіту. Так, наприклад слово «мама» можна закодувати англійськими літерами як тата, а перекладається воно англійською як mother.

У природних мовах використовується переважно такий спосіб кодуван­ня звуків усної мови, коли кожному звуку відповідає певна літера алфаві­ту Скільки звуків — стільки різних між собою літер. У деяких мовах окремі звуки кодуються збігом літер або літерами з позначками.

У технічних системах, де інформація передається за допомогою сигна­лів застосовуються інші способи утворення кодів, які дозволяють викорис­товувати для кодування значно меншу кількість різних між собою знаків (сигналів), тобто значно коротший алфавіт.

Найкоротшим є алфавіт, який складається лише з двох знаків. Він нази­вається двійковим. Код, який утворюється на основі двійкового алфавіту, теж називається двійковим.

Наприклад, за азбукою Морзе всі літери кодуються за допомогою тільки двох знаків – крапки та тире, але коди літер розрізняються між собою не тільки за комбінацією знаків • та -, але й за їх сумарною кількістю в коді, тобто за довжиною коду. Через це при передаванні текстів Морзе необхідно використовувати ще один умовний знак, потрібний для відокремлення лі­тер — паузу між ними. Тому можна вважати, що азбука Морзе має три знаки в алфавіті: крапку, тире та пропуск.

У технічних системах віддають перевагу кодам фіксованої довжини, оскільки це позбавляє необхідності вживати спеціальне позначення для ві­докремлення кодів: безперервна послідовність кодів просто розділяється на, окремі рівні за довжиною порції.

Якщо вибрано певний алфавіт і зафіксовано довжину коду, то кількість різних між собою кодів, які можна утворити, виявляється обмеженою, і її можна точно визначити за кількістю знаків алфавіту і за довжиною коду.

Для знаків двійкового алфавіту звичайно вибираються цифри 0 та 1. На вічміну від звичайних десяткових цифр, їх називають двійковими знаками, або бітами, це скорочення від англійського binary digit, що означає «двій­ковий знак» або «двійкова цифра».

Якщо позначити довжину коду через п, то

для n=1 існує 2 різні коди: 0,1;

для n= 2 існує 4 коди: 00,01,10,11;

для n=3 існує 8 кодів: 000, 001, 010, 011, 100, 101, 110, 111.

Кожне збільшення довжини коду на одиницю подвоює кількість можливих кодів.

Максимальна кількість різних між собою двійкових кодів однозначно визначається довжиною коду п і дорівнює 2n. Інакше кажучи, за допомо­гою двійкового коду довжиною п можна закодувати 2n літер чи будь-яких інших символів, призначивши кожному з них свій індивідуальний код.

Двійкове кодування є основним способом представлення інформації в комп'ютерних системах і взагалі в електронній техніці, тому що воно до­зволяє забезпечити надійність передавання й опрацьовування інформації.

Надійність забезпечується, по-перше, необхідністю розрізнення лише двох станів елементів: один стан відповідав нульовому знаменню, другий — одиничному. Елементів, які здатні стійко підтримувати два стани, в елек­тронній техніці є достатньо. Наприклад, можна чітко розрізняти два стани намагніченості елемента — вона є чи її немає, два стани електричної на­пруги — додатна вона чи від'ємна тощо. Це дозволяє впевнено виділяти корисний сигнал серед шумів і забезпечувати збереження інформації від пошкоджень за технічних умов.

З іншого боку, всі операції з опрацювання інформації, представленої двійковими кодами, зводяться до найпростіших дій над нулем та одини­цею. Такі операції достатньо просто реалізувати технічно. Це зумовлює зручність застосування двійкового кодування в електронних системах опрацювання інформації.

Двійкові коди, які застосовуються в комп'ютерних системах для пред­ставлення арабських цифр, латинських літер (великих та маленьких), роз­ділових знаків, математичних та деяких графічних і спеціальних симво­лів, закріплені міжнародним погодженням. Ці коди представлені таблицею ASCII (American Standard Code for Information Interchange — американ­ський стандартний код для обміну інформацією). Ця таблиця встановлює 128 кодів для представлення перелічених вище символів. Ще 128 кодів дозволяється використати для подання символів, які застосовуються в країні для внутрішнього обміну інформацією — літер національної мови та ін­ших. Таким чином, встановлено 256-кодову систему для комп'ютерного спілкування. Для кодування українських літер застосовуються різні систе­ми, з них найбільш розповсюдженими є КОІ8-У та Windows-1251.

У таблиці ASCII всі коди є восьмизначними, тобто представлені вісьмо­ма двійковими знаками, або вісьмома бітами. Для позначення вісімки бітів використовується спеціальна назва — байт (від англ. byte), тобто, 1 байт — 8 бітів. Таким чином, для кодування 1 символу потрібен 1 байт. Це озна­чає, що кожний символ у системах, які застосовують ASCII коди, подаєть­ся 1 байтом.

У комп'ютерних системах обсяг інформації, яка надійшла в систему, зберігається чи обробляється в ній, визначається за кількістю байтів, яки­ми вона представлена.

На практиці застосовують більш ємні одиниці вимірювання обсягу ін­формації, їх наведено у таблиці. Число 1024, яке є множником при пере­ході до більш ємної одиниці вимірювання, дорівнює 210.



Інформаційні процеси

До інформаційних процесів належать процеси збирання, опрацювання, нагромадження, зберігання, пошуку та передавання інформації. Інформа­ційні процеси відбуваються у людському суспільстві, у живій природі й у технічних системах.

Збирання інформації

Збирання інформації — це сукупність операцій, заходів та процедур, метою яких є здобуття інформації, потрібної для прийняття рішення, роз­в'язування задачі, досягнення поставленої мети тощо.

Основними інструментами пізнання світу для людини є органи чуття, які постачають інформацію людині про зовнішнє оточення навіть незалежно від її бажання. Проте наші потреби в інформації не задовольняються ні тією її частиною, яку ми отримуємо мимохіть, ні обмеженими можливостями наших органів чуття. Щоб діяти, приймати рішення, нам завжди необхідна інформація, яка сама собою не надходить до нас. її ми маємо здобути само­стійно, застосовуючи спеціальні технічні пристрої, які дозволяють виходи­ти далеко за межі доступного нашим органам чуття, здійснювати складні аналізи та кількісні вимірювання властивостей об'єктів, що вивчаються. До­сить згадати телескоп, рентгенівський апарат, ультразвуковий локатор тощо.

До основних методів збирання інформації належать: спостереження, ви­мірювання, експеримент, опитування, анкетування, тестування.

Спостереження означає реєстрацію поведінки об'єкта чи явища, який нас цікавить, без втручання у нього. Так ми отримуємо інформацію про життя тварин на волі, природні явища. Спостереження здебільшого дають можливість здобути інформацію, яка має описовий характер, тобто якісну.

Вимірювання — це реєстрація показників вимірювальних приладів, які дають об'єктивні кількісні дані про характеристики об'єкта чи явища, що вивчається. Так нагромаджуються, наприклад, метеорологічні дані, дані астрономічних спостережень.

Сутність експерименту полягає у здійсненні цілеспрямованих впливів на об'єкт чи явище і вивчення його реакції на ці впливи. Проведення експе­рименту є потужним методом наукового пізнання дійсності. Експеримент проводиться на натурних об'єктах або на їх фізичних моделях. З розвитком обчислювальної техніки широкого застосування набув комп'ютерний експе­римент, який проводиться з комп'ютерною моделлю того об'єкта чи явища, що досліджується.

На практиці спостереження, вимірювання і експеримент здебільшого застосовуються комплексно. Виконуючи спостереження, звертаються і до вимірювання, а експеримент обов'язково спирається на те і друге.

Опитування, анкетування, тестування є методами здобуття інформації у людському суспільстві.

Опитування означає отримання інформації у формі відповідей на за­питання, сформульовані заздалегідь або в процесі співбесіди. Так, важ­ливу інформацію для встановлення діагнозу лікар здобуває, розпитуючи хворого про його самовідчуття. Для виявлення якості наданих послуг або проданих товарів здійснюють опитування споживачів.

Анкетування передбачає цілеспрямоване збирання даних за спеціально розробленим переліком, однаковим для кожного з учасників анкетування. Так, для отримання даних про кількісний та якісний склад населення краї­ни застосовується процедура перепису населення, в ході якої здійснюється

анкетування громадян за заздалегідь розробленою схемою. Стандартну ан­кету з особовими даними заповнює будь-яка людина при працевлаштуванні. Навіть у класному журналі є сторінка, де наведено типові дані про учня: прізвище, ім'я та по батькові, день народження, адреса, телефон тощо.

Тестування теж спирається на заздалегідь розроблену низку питань, але передбачає для кожного з них можливі варіанти відповіді і порівняння наданих відповідей я очікуваними. Тестування спрямоване на отримання інформації, потрібної для здійснення контролюючих функцій. Наприклад, за допомогою тестування збирається інформація про якість знань учнів, виявляються їх психічні особливості, нахили, здібності. Тестування вико­ристовується і в технічних системах. Так, за допомогою спеціальних ви­пробувань здійснюється перевірка працездатності апаратури або програ­ми, а в разі відхилень отриманих даних від очікуваних встановлюється місце пошкодження або причина помилок.

Опрацювання інформації

Опрацювання інформації — це сукупність цілеспрямованих дій над здобутою інформацією з метою отримання нової інформації.

Зібрана з різних джерел інформація вивчається, порівнюється, оціню­ється, аналізується, осмислюється, і на цій основі створюється нова інфор­мація. Продукування нової інформації на базі зібраної становить сутність процесу опрацювання,

Так, аналіз численних даних астрономічних спостережень, які зали­шив після себе Тихо Браге, дозволив Йоганну Кеплеру висунути гіпотезу про існування фундаментальних законів руху планет, відкрити та довести ці закони.

Стосовно процесу опрацювання інформації людиною, живим організ­мом чи технічним пристроєм розрізняють вхідну (первісну) інформацію, яка отримується до початку процесу, і вихідну (вторинну), яка є результа­том цього процесу.

Опрацювання інформації звичайно складається з декількох етапів і може містити такі:

фільтрація інформації, тобто відсіювання зайвих даних, у яких немає потреби для розв'язування даної задачі (наприклад, для визначення площі будівлі немає значення, з яких матеріалів її побудовано, а для визначення її вартості такі дані необхідні);

формалізація, або подання інформації у певній формі, придатній для опрацьовування (наприклад, подання інформації, зафіксованої самопис­цем у вигляді неперервної кривої як послідовності числових значень). Формалізована інформація, яка призначається для використання (опра­цювання, зберігання, пересилання, інтерпретації) користувачами, при­кладними процесами чи технічними засобами, називається даними; структурування, сутність якого полягає у спеціальній організації да­них для зручності їх опрацювання (наприклад, об'єднання однотипних даних у масиви);

власне опрацювання, яке може здійснюватися шляхом логічного аналі­зу інформації, умовиводів або шляхом виконання певної послідовності дій над даними для отримання потрібного результату. Така послідовність називається алгоритмом (наприклад, для знаходження площі трикутни­ка за даними довжинами його сторін треба, по-перше, визначити його периметр і, по-друге, обчислити шукану площу за формулою Герона);

перетворення інформації до такої форми подання, яка зручна для її сприйняття, усвідомлення та подальшого використання (наприклад, у технічних системах, які призначаються для опрацювання інформації, вона циркулює у вигляді сигналів, і для того, щоб результати опрацю­вання стали придатні для сприйняття людиною, інформацію перетво­рюють у числову, текстову, графічну або звукову форму, добираючи найбільш природний та виразний спосіб її подання).

Протягом тисячоліть існування людства опрацювання інформації здійснювалося виключно силами людського мозку, і тільки шість століть тому було винайдено перші механічні пристрої для виконання арифметичних операцій. Справжнім помічником людини в опрацюванні інформації будь-якого виду — числової, текстової, графічної, звукової стали комп'ютери, історія яких як універсальних засобів опрацювання інформації налічує лише близько півстоліття.

Нагромадження інформації

Нагромадження інформації це її підготовка для подальшого вико­ристання.

Як правило, інформація не застосовується там і тоді, коли її отримано. Вона потребує нагромадження та збереження для того, щоб нею було мож­ливо скористатися у подальшому.

Процес нагромадження інформації передбачає здійснення таких опера­цій, як:

сортування, тобто групування даних відповідно до певних правил або ознак (наприклад, за призначенням, формою подання); упорядкування, або розташування даних у певній послідовності (напри­клад, за алфавітом, за зростанням чи спаданням певного параметра); систематизація, що означає укладення інформації у такому порядку, який полегшує знаходження потрібної інформації).

Так ми сортуємо власну бібліотеку, групуючи окремо художню літерату­ру, навчальну, довідкову, кулінарні книги та книги з догляду за житлом. Записи номерів телефонів друзів та знайомих упорядковуємо за першою літерою їх прізвищ. Розкладом занять у школі зручно користуватися тому, що інформацію в ньому систематизовано за днями тижня і за номерами класів. У наш час, коли інформаційні технології є широко розповсюдженими, нагромадження найбільш важливої інформації про діяльність банків, тор­говельних фірм, промислових об'єктів, навчальних закладів тощо здійсню­ється автоматизовано, за допомогою інформаційних систем.

Зберігання інформації

Зберігання інформації — це комплекс дій, метою яких є захист нагро­мадженої інформації від втрати, зіпсування, зруйнування, пошкодження.

Інформація завжди нагромаджується на певному носії, тому зберіган­ня інформації потребує перш за все надійних носіїв, що якомога менше піддаються фізичному зносу. У процесі розвитку людства неперервно вдо­сконалювалися й носії інформації: на зміну глиняним таблицям та папі­русним сувоям прийшли друковані книги, а в наші часи на перше місце виходять електронні носії інформації — оптичні та магнітні диски, які здатні надійно та компактно зберігати величезні обсяги інформації. Сьо­годні на одному лазерному диску можна розмістити цілу бібліотеку — близько 1000 книжок по 300 сторінок у кожній. Термін придатності тако­го диска становить 100 років, а ціна у продажу не перевищує середньої ціни однієї книги. Для додаткового підвищення компактності розміщен­ня електронної інформації на носії застосовують спеціальні програми-архіватори, які дозволяють ущільнювати записи, скорочуючи, наприклад, обсяг текстової інформації приблизно втричі.

Сучасна технологія інформаційних носіїв розвивається дуже стрімко, пропонуючи людству все більш надійні, компактні та доступні засоби збе­реження інформації.

У наш час, коли переважна більшість інформації, у тому числі й фінан­сової, науково-технічної, статистичної, зберігається і циркулює в техніч­них системах, однією з найважливіших проблем є захист інформації від несанкціонованого доступу до неї, від пошкоджень у процесі її збереження. Причиною пошкодження інформації можуть бути раптові збої апаратури, недосконалість технічних пристроїв або зловмисне проникнення у комп'ю­терну систему.

Комп'ютерні злочини сьогодні посідають одне з перших місць серед економічних злочинів. Вони здійснюються з метою вилучення, викрив­лення, копіювання та недозволеного використання інформації, що зберіга­ється в комп'ютерній системі. Кількість комп'ютерних злочинів у світі та матеріальні збитки від них щороку зростають, тому вживаються спеціаль­ні заходи для захисту інформації:
    • законодавчі, які визнають інформацію об'єктом кримінально-правового захисту і встановлюють кримінальну відповідальність за комп'ютерні злочини;
    • програмні, які перешкоджають несанкціонованому доступу до інформа­ції в комп'ютерній системі;
    • організаційно-технічні, які спрямовані на забезпечення працездатності та технічного захисту комп'ютерного обладнання, на регламентацію доступу до нього.

Найпоширенішою причиною пошкодження інформації у комп'ютерних системах є віруси. Це програми, які здатні приєднуватися до інших про­грам і при їх запуску виконують різні небажані дії: пошкоджують або знищують інформацію, вилучають файли тощо. Більшість з вірусів створена аматорами-програмістами без злочинного задуму, як необережна проба юнацьких сил у програмуванні, у змаганні з комп'ютером. Проте поширення ; вірусу може мати такі наслідки, як знищення інформації, вихід із ладу ; комп'ютерної системи, і аматор мимоволі перетворюється на злочинця. ' Сьогодні відомо десятки тисяч комп'ютерних вірусів, відомі й засоби : лікування майже від усіх них, проте з'являються все нові й нові віруси. і Протягом усього розвитку комп'ютерних систем триває суперництво між ' розробниками засобів захисту інформації і зломлювачами захисних бар'єрів, між створювачами комп'ютерних вірусів і лікарями від них.

Пошук інформації

Пошук інформації — це сукупність операцій, заходів та процедур, ; метою яких є знаходження потрібної інформації у фонді даних, що зберігаються.

Для автоматизації пошуку та надання користувачеві потрібної інформації незалежно від місця її зберігання призначаються інформаційно-пошукові системи. Кожна така система працює з певним масивом даних.

Масиви даних стосовно певної галузі чи предметної області, організова­ні за спеціальними правилами, що встановлюють загальні принципи опи­су, зберігання та маніпулювання даними, називаються базами даних. Об'­єднання декількох баз даних і системи керування базами даних називається банком даних. Банки даних створюються для обслуговування інформацій­них потреб певних категорій користувачів і містять сукупність різнорідної інформації, потрібної спеціалісту того чи іншого профілю. Так, існують банки даних з економіки, юриспруденції, медицини тощо.

Пошук та вибирання інформації з баз даних здійснюються за запитом кори­стувача, який встановлює умови пошуку: задає ключове слово, певні властивості даних чи обмеження. Для пошуку застосовуються спеціальні методи опрацю­вання великих масивів даних, які, спираючись на правила організації даних у базі, дозволяють оптимізувати пошук, скоротити потрібний для нього час.

Сьогодні широкий доступ до різноманітної інформації, поданої в електрон­ній формі, забезпечується глобальною мережею Інтернет, яка містить без перебільшення гігантські обсяги інформації. Скористатися цим ресурсом, знайти потрібні дані у цьому безмежному інформаційному просторі можна саме тому, що пошук потрібної інформації в Інтернеті здійснюється автома­тизовано: його беруть на себе інформаційно-пошукові системи, які надають цю послугу будь-якому замовнику безкоштовно. Найвідомішими такими системами є, наприклад, Рамблер, Яндекс та ін. Разом з тим, для ефектив­ної взаємодії з інформаційно-пошуковими системами необхідно володіти правилами навігації в Інтернет-просторі.

Передавання інформації

Передавання (або транспортування) інформації є процесом перемі­щення даних від одного пункту до іншого (або декількох інших).

Як відомо, інформація майже ніколи не використовується у тому місці, де вона виникає, тому її необхідно передавати (транспортувати) від пункту виникнення до пункту споживання. У будь-якому процесі передавання ін­формації завжди можна виділити таких його учасників:
    • джерело інформації, звідки вона надходить;
    • приймача (або споживача) інформації (одного чи декількох), який її отримує;
    • канал, за яким здійснюється передавання інформації.

В інформаційних мережах для позначення двох кінцевих учасників
процесу передавання інформації застосовуються такі терміни: сервер і клієнт. Сервер — це комп'ютер, завданням якого є обслуговування інших абонентів мережі — клієнтів.

Людина застосовує різні канали передавання інформації і виступає то в ролі джерела інформації, то в ролі її приймача.

Наприклад, якщо вам треба дізнатися про час прибуття літака, то ви швидше за все зателефонуєте у довідкове бюро аеропорту, і службовець бюро, надаючи вам потрібну інформацію, виступить її джерелом, ви — споживачем, а каналом передавання — телефонна лінія. Якщо ж ви хочете надіслати термінове повідомлення в інше місто, то можете скористатися телеграфом, і в такому разі ви станете джерелом інформації, ваш адресат — споживачем, телеграфна лінія — каналом передавання. Повсякденно ви отримуєте і передаєте інформацію звуковим каналом або оптичним — у межах прямої видимості.

На шляху інформації від джерела до приймача можуть бути залученими . по черзі декілька каналів, якщо інформація передається поетапно. Наприклад, щодня ми дізнаємося про останні події у світі, а якщо простежити шлях цієї інформації навіть у найпростішому випадку, то виявиться, що він склада­ється з декількох етапів: кореспондент передає новину з місця події звичайно телефоном або електронною поштою, текст потрапляє до редактора новин у друкованому вигляді, диктор зачитує текст у передачі «Вісті», телекамера передає випуск новин в ефір, і врешті-решт телеглядачі, чиї телевізори налаш­товані на відповідну хвилю, отримують інформацію про новину. На кожному етапі шляху новини від кореспондента до телеглядача можна виділити своє джерело, свого приймача і свій канал інформації.

При передаванні інформації її носієм звичайно виступає хвильовий про­цес: наприклад, розповсюдження звукової, електромагнітної, оптичної хвилі. Такі носії інформації іноді називають недовгоіснуючими, тому що інфор­мація пов'язується з носієм тільки на порівняно короткий термін розпо­всюдження хвилі. На відміну від таких носіїв є довгоіснуючі, з якими ін­формація пов'язується на тривалий час — наприклад, папір, фотоплівка, магнітний диск тощо. Вони застосовуються переважно для зберігання інфор­мації. Іноді і передавання інформації здійснюється з використанням довгоіснуючого носія. Це звичайно стосується таких випадків, коли потрібно водночас і передати, і зберегти інформацію. Наприклад, надіслати відомості у вигляді паперового документа з тим, щоб ці відомості зберігалися. Якщо раніше інформація на відстань надсилалася майже виключно шляхом фі­зичного транспортування її «твердого» носія, то тепер в офіційному і між-особистісному інформаційному обміні віддають перевагу безпаперовим тех­нологіям. Так, у документообороті широко застосовуються електронна пошта і факс – прилад, який поєднує в собі сканер і друкувальний пристрій і здійснює передавання та приймання графічних зображень телефонними лініями зв'язку. Щодо людського спілкування, то і тут все більшого поши­рення набуває електронне листування, мобільний зв'язок, які забезпечу­ють передавання радіоканалами не тільки текстів, а й зображень.

Збільшення ролі інформації у житті людини і суспільства стимулює створення все більш швидких та надійних засобів передавання інформації, і ми є свідками стрімкого й безупинного прогресу технологій інформацій­ного обміну.