Кодування інформації

Вид материала

Содержание

Збирання інформації
Опрацювання інформації
Нагромадження інформації
Зберігання інформації
Пошук інформації

Подобный материал:

Кодування інформації

Вибір того чи іншого способу подання інформації означає вибір певної мови.

Мовою називається система знаків та правил, яка забезпечує спілкування, а також відображення, опис та передавання інформації. Таким чином, можна говорити про мову міміки, жестів, розмовну мову, мову умовних знаків тощо.

Розрізняють мови природні та штучні. Кількість природних мов та діалектів, які існують в світі, становить близько 10 000. Природні мови утворилися в процесі формування людського суспільства і продовжують розвиватися.

Штучні мови призначаються для окремих галузей діяльності людини. Так, наприклад, у навчанні математики використовується мова математичної символіки, а для розв'язування задач на комп'ютері — мова програмування. Характерною особливістю штучних мов є формалізованість, точна визначеність правил мови, без знання яких її використання неможливе. Штучні мови створюються в результаті діяльності відповідних фахівців. Так, в історії математики простежується довгий шлях формування звичних для нас математичних позначень. Історія мов програмування значно коротша: вона бере свій початок із середини минулого століття. Проте сьогодні існують тисячі мов спілкування з комп'ютером, і це відбиває різноплановість задач, для розв'язання яких він застосовується.

Основу будь-якої мови складає її алфавіт.

Алфавітом називається упорядкована сукупність усіх різних знаків мови. Слово «алфавіт» походить від грецького alphabetos, тобто від назв перших двох літер грецької абетки — alpha та beta. Кількість знаків, з яких складається алфавіт, іноді називають його потужністю. Кожному знакові алфавіту надається певний смисл.

У процесі передавання чи зберігання інформації часто доводиться переходити від одного способу подання інформації до іншого, тобто з однієї мови на іншу. Наприклад, при написанні телеграми виникає ряд перетворень:

усний текст — письмовий текст — електричні сигнали - письмовий текст. Усі перетворення усно складеного тексту були формальними, вони відбувалися на рівні знаків алфавіту за певними правилами.

" Перетворення символів одного алфавіту на символи іншого алфавіту за певними правилами називається кодуванням (від латинського слова codex -звід законів), а результат цього перетворення - кодом.

Хоча кодування й нагадує перекладання з однієї мови на іншу, проте це не так Якщо йдеться про переклад, то передається смислове значення тексту і при кодуванні відбувається формальна заміна: знакові одного алфавіту за певним правилом ставиться у відповідність знак іншого алфавіту. Так, наприклад слово «мама» можна закодувати англійськими літерами як тата, а перекладається воно англійською як mother.

У природних мовах використовується переважно такий спосіб кодування звуків усної мови, коли кожному звуку відповідає певна літера алфавіту Скільки звуків — стільки різних між собою літер. У деяких мовах окремі звуки кодуються збігом літер або літерами з позначками.

У технічних системах, де інформація передається за допомогою сигналів застосовуються інші способи утворення кодів, які дозволяють використовувати для кодування значно меншу кількість різних між собою знаків (сигналів), тобто значно коротший алфавіт.

Найкоротшим є алфавіт, який складається лише з двох знаків. Він називається двійковим. Код, який утворюється на основі двійкового алфавіту, теж називається двійковим.

Наприклад, за азбукою Морзе всі літери кодуються за допомогою тільки двох знаків – крапки та тире, але коди літер розрізняються між собою не тільки за комбінацією знаків • та -, але й за їх сумарною кількістю в коді, тобто за довжиною коду. Через це при передаванні текстів Морзе необхідно використовувати ще один умовний знак, потрібний для відокремлення літер — паузу між ними. Тому можна вважати, що азбука Морзе має три знаки в алфавіті: крапку, тире та пропуск.

У технічних системах віддають перевагу кодам фіксованої довжини, оскільки це позбавляє необхідності вживати спеціальне позначення для відокремлення кодів: безперервна послідовність кодів просто розділяється на, окремі рівні за довжиною порції.

Якщо вибрано певний алфавіт і зафіксовано довжину коду, то кількість різних між собою кодів, які можна утворити, виявляється обмеженою, і її можна точно визначити за кількістю знаків алфавіту і за довжиною коду.

Для знаків двійкового алфавіту звичайно вибираються цифри 0 та 1. На вічміну від звичайних десяткових цифр, їх називають двійковими знаками, або бітами, це скорочення від англійського binary digit, що означає «двійковий знак» або «двійкова цифра».

Якщо позначити довжину коду через п, то

для n=1 існує 2 різні коди: 0,1;

для n= 2 існує 4 коди: 00,01,10,11;

для n=3 існує 8 кодів: 000, 001, 010, 011, 100, 101, 110, 111.

Кожне збільшення довжини коду на одиницю подвоює кількість можливих кодів.

Максимальна кількість різних між собою двійкових кодів однозначно визначається довжиною коду п і дорівнює 2ⁿ. Інакше кажучи, за допомогою двійкового коду довжиною п можна закодувати 2ⁿ літер чи будь-яких інших символів, призначивши кожному з них свій індивідуальний код.

Двійкове кодування є основним способом представлення інформації в комп'ютерних системах і взагалі в електронній техніці, тому що воно дозволяє забезпечити надійність передавання й опрацьовування інформації.

Надійність забезпечується, по-перше, необхідністю розрізнення лише двох станів елементів: один стан відповідав нульовому знаменню, другий — одиничному. Елементів, які здатні стійко підтримувати два стани, в електронній техніці є достатньо. Наприклад, можна чітко розрізняти два стани намагніченості елемента — вона є чи її немає, два стани електричної напруги — додатна вона чи від'ємна тощо. Це дозволяє впевнено виділяти корисний сигнал серед шумів і забезпечувати збереження інформації від пошкоджень за технічних умов.

З іншого боку, всі операції з опрацювання інформації, представленої двійковими кодами, зводяться до найпростіших дій над нулем та одиницею. Такі операції достатньо просто реалізувати технічно. Це зумовлює зручність застосування двійкового кодування в електронних системах опрацювання інформації.

Двійкові коди, які застосовуються в комп'ютерних системах для представлення арабських цифр, латинських літер (великих та маленьких), розділових знаків, математичних та деяких графічних і спеціальних символів, закріплені міжнародним погодженням. Ці коди представлені таблицею ASCII (American Standard Code for Information Interchange — американський стандартний код для обміну інформацією). Ця таблиця встановлює 128 кодів для представлення перелічених вище символів. Ще 128 кодів дозволяється використати для подання символів, які застосовуються в країні для внутрішнього обміну інформацією — літер національної мови та інших. Таким чином, встановлено 256-кодову систему для комп'ютерного спілкування. Для кодування українських літер застосовуються різні системи, з них найбільш розповсюдженими є КОІ8-У та Windows-1251.

У таблиці ASCII всі коди є восьмизначними, тобто представлені вісьмома двійковими знаками, або вісьмома бітами. Для позначення вісімки бітів використовується спеціальна назва — байт (від англ. byte), тобто, 1 байт — 8 бітів. Таким чином, для кодування 1 символу потрібен 1 байт. Це означає, що кожний символ у системах, які застосовують ASCII коди, подається 1 байтом.

У комп'ютерних системах обсяг інформації, яка надійшла в систему, зберігається чи обробляється в ній, визначається за кількістю байтів, якими вона представлена.

На практиці застосовують більш ємні одиниці вимірювання обсягу інформації, їх наведено у таблиці. Число 1024, яке є множником при переході до більш ємної одиниці вимірювання, дорівнює 2¹⁰.

Інформаційні процеси

До інформаційних процесів належать процеси збирання, опрацювання, нагромадження, зберігання, пошуку та передавання інформації. Інформаційні процеси відбуваються у людському суспільстві, у живій природі й у технічних системах.

Збирання інформації

Збирання інформації — це сукупність операцій, заходів та процедур, метою яких є здобуття інформації, потрібної для прийняття рішення, розв'язування задачі, досягнення поставленої мети тощо.

Основними інструментами пізнання світу для людини є органи чуття, які постачають інформацію людині про зовнішнє оточення навіть незалежно від її бажання. Проте наші потреби в інформації не задовольняються ні тією її частиною, яку ми отримуємо мимохіть, ні обмеженими можливостями наших органів чуття. Щоб діяти, приймати рішення, нам завжди необхідна інформація, яка сама собою не надходить до нас. її ми маємо здобути самостійно, застосовуючи спеціальні технічні пристрої, які дозволяють виходити далеко за межі доступного нашим органам чуття, здійснювати складні аналізи та кількісні вимірювання властивостей об'єктів, що вивчаються. Досить згадати телескоп, рентгенівський апарат, ультразвуковий локатор тощо.

До основних методів збирання інформації належать: спостереження, вимірювання, експеримент, опитування, анкетування, тестування.

Спостереження означає реєстрацію поведінки об'єкта чи явища, який нас цікавить, без втручання у нього. Так ми отримуємо інформацію про життя тварин на волі, природні явища. Спостереження здебільшого дають можливість здобути інформацію, яка має описовий характер, тобто якісну.

Вимірювання — це реєстрація показників вимірювальних приладів, які дають об'єктивні кількісні дані про характеристики об'єкта чи явища, що вивчається. Так нагромаджуються, наприклад, метеорологічні дані, дані астрономічних спостережень.

Сутність експерименту полягає у здійсненні цілеспрямованих впливів на об'єкт чи явище і вивчення його реакції на ці впливи. Проведення експерименту є потужним методом наукового пізнання дійсності. Експеримент проводиться на натурних об'єктах або на їх фізичних моделях. З розвитком обчислювальної техніки широкого застосування набув комп'ютерний експеримент, який проводиться з комп'ютерною моделлю того об'єкта чи явища, що досліджується.

На практиці спостереження, вимірювання і експеримент здебільшого застосовуються комплексно. Виконуючи спостереження, звертаються і до вимірювання, а експеримент обов'язково спирається на те і друге.

Опитування, анкетування, тестування є методами здобуття інформації у людському суспільстві.

Опитування означає отримання інформації у формі відповідей на запитання, сформульовані заздалегідь або в процесі співбесіди. Так, важливу інформацію для встановлення діагнозу лікар здобуває, розпитуючи хворого про його самовідчуття. Для виявлення якості наданих послуг або проданих товарів здійснюють опитування споживачів.

Анкетування передбачає цілеспрямоване збирання даних за спеціально розробленим переліком, однаковим для кожного з учасників анкетування. Так, для отримання даних про кількісний та якісний склад населення країни застосовується процедура перепису населення, в ході якої здійснюється

анкетування громадян за заздалегідь розробленою схемою. Стандартну анкету з особовими даними заповнює будь-яка людина при працевлаштуванні. Навіть у класному журналі є сторінка, де наведено типові дані про учня: прізвище, ім'я та по батькові, день народження, адреса, телефон тощо.

Тестування теж спирається на заздалегідь розроблену низку питань, але передбачає для кожного з них можливі варіанти відповіді і порівняння наданих відповідей я очікуваними. Тестування спрямоване на отримання інформації, потрібної для здійснення контролюючих функцій. Наприклад, за допомогою тестування збирається інформація про якість знань учнів, виявляються їх психічні особливості, нахили, здібності. Тестування використовується і в технічних системах. Так, за допомогою спеціальних випробувань здійснюється перевірка працездатності апаратури або програми, а в разі відхилень отриманих даних від очікуваних встановлюється місце пошкодження або причина помилок.

Опрацювання інформації

Опрацювання інформації — це сукупність цілеспрямованих дій над здобутою інформацією з метою отримання нової інформації.

Зібрана з різних джерел інформація вивчається, порівнюється, оцінюється, аналізується, осмислюється, і на цій основі створюється нова інформація. Продукування нової інформації на базі зібраної становить сутність процесу опрацювання,

Так, аналіз численних даних астрономічних спостережень, які залишив після себе Тихо Браге, дозволив Йоганну Кеплеру висунути гіпотезу про існування фундаментальних законів руху планет, відкрити та довести ці закони.

Стосовно процесу опрацювання інформації людиною, живим організмом чи технічним пристроєм розрізняють вхідну (первісну) інформацію, яка отримується до початку процесу, і вихідну (вторинну), яка є результатом цього процесу.

Опрацювання інформації звичайно складається з декількох етапів і може містити такі:

фільтрація інформації, тобто відсіювання зайвих даних, у яких немає потреби для розв'язування даної задачі (наприклад, для визначення площі будівлі немає значення, з яких матеріалів її побудовано, а для визначення її вартості такі дані необхідні);

формалізація, або подання інформації у певній формі, придатній для опрацьовування (наприклад, подання інформації, зафіксованої самописцем у вигляді неперервної кривої як послідовності числових значень). Формалізована інформація, яка призначається для використання (опрацювання, зберігання, пересилання, інтерпретації) користувачами, прикладними процесами чи технічними засобами, називається даними; структурування, сутність якого полягає у спеціальній організації даних для зручності їх опрацювання (наприклад, об'єднання однотипних даних у масиви);

власне опрацювання, яке може здійснюватися шляхом логічного аналізу інформації, умовиводів або шляхом виконання певної послідовності дій над даними для отримання потрібного результату. Така послідовність називається алгоритмом (наприклад, для знаходження площі трикутника за даними довжинами його сторін треба, по-перше, визначити його периметр і, по-друге, обчислити шукану площу за формулою Герона);

• перетворення інформації до такої форми подання, яка зручна для її сприйняття, усвідомлення та подальшого використання (наприклад, у технічних системах, які призначаються для опрацювання інформації, вона циркулює у вигляді сигналів, і для того, щоб результати опрацювання стали придатні для сприйняття людиною, інформацію перетворюють у числову, текстову, графічну або звукову форму, добираючи найбільш природний та виразний спосіб її подання).

Протягом тисячоліть існування людства опрацювання інформації здійснювалося виключно силами людського мозку, і тільки шість століть тому було винайдено перші механічні пристрої для виконання арифметичних операцій. Справжнім помічником людини в опрацюванні інформації будь-якого виду — числової, текстової, графічної, звукової стали комп'ютери, історія яких як універсальних засобів опрацювання інформації налічує лише близько півстоліття.

Нагромадження інформації

Нагромадження інформації — це її підготовка для подальшого використання.

Як правило, інформація не застосовується там і тоді, коли її отримано. Вона потребує нагромадження та збереження для того, щоб нею було можливо скористатися у подальшому.

Процес нагромадження інформації передбачає здійснення таких операцій, як:

сортування, тобто групування даних відповідно до певних правил або ознак (наприклад, за призначенням, формою подання); упорядкування, або розташування даних у певній послідовності (наприклад, за алфавітом, за зростанням чи спаданням певного параметра); систематизація, що означає укладення інформації у такому порядку, який полегшує знаходження потрібної інформації).

Так ми сортуємо власну бібліотеку, групуючи окремо художню літературу, навчальну, довідкову, кулінарні книги та книги з догляду за житлом. Записи номерів телефонів друзів та знайомих упорядковуємо за першою літерою їх прізвищ. Розкладом занять у школі зручно користуватися тому, що інформацію в ньому систематизовано за днями тижня і за номерами класів. У наш час, коли інформаційні технології є широко розповсюдженими, нагромадження найбільш важливої інформації про діяльність банків, торговельних фірм, промислових об'єктів, навчальних закладів тощо здійснюється автоматизовано, за допомогою інформаційних систем.

Зберігання інформації

Зберігання інформації — це комплекс дій, метою яких є захист нагромадженої інформації від втрати, зіпсування, зруйнування, пошкодження.

Інформація завжди нагромаджується на певному носії, тому зберігання інформації потребує перш за все надійних носіїв, що якомога менше піддаються фізичному зносу. У процесі розвитку людства неперервно вдосконалювалися й носії інформації: на зміну глиняним таблицям та папірусним сувоям прийшли друковані книги, а в наші часи на перше місце виходять електронні носії інформації — оптичні та магнітні диски, які здатні надійно та компактно зберігати величезні обсяги інформації. Сьогодні на одному лазерному диску можна розмістити цілу бібліотеку —

близько 1000 книжок по 300 сторінок у кожній. Термін придатності такого диска становить 100 років, а ціна у продажу не перевищує середньої ціни однієї книги. Для додаткового підвищення компактності розміщення електронної інформації на носії застосовують спеціальні програми-архіватори, які дозволяють ущільнювати записи, скорочуючи, наприклад, обсяг текстової інформації приблизно втричі.

Сучасна технологія інформаційних носіїв розвивається дуже стрімко, пропонуючи людству все більш надійні, компактні та доступні засоби збереження інформації.

У наш час, коли переважна більшість інформації, у тому числі й фінансової, науково-технічної, статистичної, зберігається і циркулює в технічних системах, однією з найважливіших проблем є захист інформації від несанкціонованого доступу до неї, від пошкоджень у процесі її збереження. Причиною пошкодження інформації можуть бути раптові збої апаратури, недосконалість технічних пристроїв або зловмисне проникнення у комп'ютерну систему.

Комп'ютерні злочини сьогодні посідають одне з перших місць серед економічних злочинів. Вони здійснюються з метою вилучення, викривлення, копіювання та недозволеного використання інформації, що зберігається в комп'ютерній системі. Кількість комп'ютерних злочинів у світі та матеріальні збитки від них щороку зростають, тому вживаються спеціальні заходи для захисту інформації:

законодавчі, які визнають інформацію об'єктом кримінально-правового захисту і встановлюють кримінальну відповідальність за комп'ютерні злочини;
програмні, які перешкоджають несанкціонованому доступу до інформації в комп'ютерній системі;
організаційно-технічні, які спрямовані на забезпечення працездатності та технічного захисту комп'ютерного обладнання, на регламентацію доступу до нього.

Найпоширенішою причиною пошкодження інформації у комп'ютерних системах є віруси. Це програми, які здатні приєднуватися до інших програм і при їх запуску виконують різні небажані дії: пошкоджують або знищують інформацію, вилучають файли тощо. Більшість з вірусів створена аматорами-програмістами без злочинного задуму, як необережна проба юнацьких сил у програмуванні, у змаганні з комп'ютером. Проте поширення ; вірусу може мати такі наслідки, як знищення інформації, вихід із ладу ; комп'ютерної системи, і аматор мимоволі перетворюється на злочинця. ' Сьогодні відомо десятки тисяч комп'ютерних вірусів, відомі й засоби : лікування майже від усіх них, проте з'являються все нові й нові віруси. і Протягом усього розвитку комп'ютерних систем триває суперництво між ' розробниками засобів захисту інформації і зломлювачами захисних бар'єрів, між створювачами комп'ютерних вірусів і лікарями від них.

Пошук інформації

Пошук інформації — це сукупність операцій, заходів та процедур, ; метою яких є знаходження потрібної інформації у фонді даних, що зберігаються.

Для автоматизації пошуку та надання користувачеві потрібної інформації незалежно від місця її зберігання призначаються інформаційно-пошукові системи. Кожна така система працює з певним масивом даних.

Масиви даних стосовно певної галузі чи предметної області, організовані за спеціальними правилами, що встановлюють загальні принципи опису, зберігання та маніпулювання даними, називаються базами даних. Об'єднання декількох баз даних і системи керування базами даних називається банком даних. Банки даних створюються для обслуговування інформаційних потреб певних категорій користувачів і містять сукупність різнорідної інформації, потрібної спеціалісту того чи іншого профілю. Так, існують банки даних з економіки, юриспруденції, медицини тощо.

Пошук та вибирання інформації з баз даних здійснюються за запитом користувача, який встановлює умови пошуку: задає ключове слово, певні властивості даних чи обмеження. Для пошуку застосовуються спеціальні методи опрацювання великих масивів даних, які, спираючись на правила організації даних у базі, дозволяють оптимізувати пошук, скоротити потрібний для нього час.

Сьогодні широкий доступ до різноманітної інформації, поданої в електронній формі, забезпечується глобальною мережею Інтернет, яка містить без перебільшення гігантські обсяги інформації. Скористатися цим ресурсом, знайти потрібні дані у цьому безмежному інформаційному просторі можна саме тому, що пошук потрібної інформації в Інтернеті здійснюється автоматизовано: його беруть на себе інформаційно-пошукові системи, які надають цю послугу будь-якому замовнику безкоштовно. Найвідомішими такими системами є, наприклад, Рамблер, Яндекс та ін. Разом з тим, для ефективної взаємодії з інформаційно-пошуковими системами необхідно володіти правилами навігації в Інтернет-просторі.

Передавання інформації

Передавання (або транспортування) інформації є процесом переміщення даних від одного пункту до іншого (або декількох інших).

Як відомо, інформація майже ніколи не використовується у тому місці, де вона виникає, тому її необхідно передавати (транспортувати) від пункту виникнення до пункту споживання. У будь-якому процесі передавання інформації завжди можна виділити таких його учасників:

джерело інформації, звідки вона надходить;
приймача (або споживача) інформації (одного чи декількох), який її отримує;
канал, за яким здійснюється передавання інформації.

В інформаційних мережах для позначення двох кінцевих учасників
процесу передавання інформації застосовуються такі терміни: сервер і клієнт. Сервер — це комп'ютер, завданням якого є обслуговування інших абонентів мережі — клієнтів.

Людина застосовує різні канали передавання інформації і виступає то в ролі джерела інформації, то в ролі її приймача.

Наприклад, якщо вам треба дізнатися про час прибуття літака, то ви швидше за все зателефонуєте у довідкове бюро аеропорту, і службовець бюро, надаючи вам потрібну інформацію, виступить її джерелом, ви — споживачем, а каналом передавання — телефонна лінія. Якщо ж ви хочете надіслати термінове повідомлення в інше місто, то можете скористатися телеграфом, і в такому разі ви станете джерелом інформації, ваш адресат — споживачем, телеграфна лінія — каналом передавання. Повсякденно ви отримуєте і передаєте інформацію звуковим каналом або оптичним — у межах прямої видимості.

На шляху інформації від джерела до приймача можуть бути залученими . по черзі декілька каналів, якщо інформація передається поетапно. Напри

клад, щодня ми дізнаємося про останні події у світі, а якщо простежити шлях цієї інформації навіть у найпростішому випадку, то виявиться, що він складається з декількох етапів: кореспондент передає новину з місця події звичайно телефоном або електронною поштою, текст потрапляє до редактора новин у друкованому вигляді, диктор зачитує текст у передачі «Вісті», телекамера передає випуск новин в ефір, і врешті-решт телеглядачі, чиї телевізори налаштовані на відповідну хвилю, отримують інформацію про новину. На кожному етапі шляху новини від кореспондента до телеглядача можна виділити своє джерело, свого приймача і свій канал інформації.

При передаванні інформації її носієм звичайно виступає хвильовий процес: наприклад, розповсюдження звукової, електромагнітної, оптичної хвилі. Такі носії інформації іноді називають недовгоіснуючими, тому що інформація пов'язується з носієм тільки на порівняно короткий термін розповсюдження хвилі. На відміну від таких носіїв є довгоіснуючі, з якими інформація пов'язується на тривалий час — наприклад, папір, фотоплівка, магнітний диск тощо. Вони застосовуються переважно для зберігання інформації. Іноді і передавання інформації здійснюється з використанням довгоіснуючого носія. Це звичайно стосується таких випадків, коли потрібно водночас і передати, і зберегти інформацію. Наприклад, надіслати відомості у вигляді паперового документа з тим, щоб ці відомості зберігалися. Якщо раніше інформація на відстань надсилалася майже виключно шляхом фізичного транспортування її «твердого» носія, то тепер в офіційному і між-особистісному інформаційному обміні віддають перевагу безпаперовим технологіям. Так, у документообороті широко застосовуються електронна пошта і факс – прилад, який поєднує в собі сканер і друкувальний пристрій і здійснює передавання та приймання графічних зображень телефонними лініями зв'язку. Щодо людського спілкування, то і тут все більшого поширення набуває електронне листування, мобільний зв'язок, які забезпечують передавання радіоканалами не тільки текстів, а й зображень.

Збільшення ролі інформації у житті людини і суспільства стимулює створення все більш швидких та надійних засобів передавання інформації, і ми є свідками стрімкого й безупинного прогресу технологій інформаційного обміну.

Blog

Кодування інформації

Содержание