Лекция №4-5 Измерение информации Пример
Вид материала | Лекция |
- «измерение», 44.31kb.
- Тема классификационный анализ лекция, 63.18kb.
- Измерение информации. Количество информации. Единицы измерения информации, 328.73kb.
- Дискретных Марковских Цепей) в анализе данных. Пример применения. (лекция, 7.29kb.
- Муниципальное образовательное учреждение Пошатовская средняя общеобразовательная школа, 201.78kb.
- Карпов Дмитрий Анатольевич лекция, 472.96kb.
- Vi. Измерение вредных производственных факторов рабочих мест, 43.78kb.
- Учебный план курсовой подготовки по пользователю, 46.52kb.
- Методические указания к лабораторной работе, 454.05kb.
- Текст лекций н. О. Воскресенская Оглавление Лекция 1: Введение в дисциплину. Предмет, 1185.25kb.
Что учащемуся необходимо уметь
Задание 1
Всегда ли при автоматизированном и «ручном» выполнении информационных процессов используются одинаковые методы? Приведите примеры, когда методы подобны и когда они существенно отличаются друг от друга.
Задание 2
Кодирование информации вполне можно рассматривать как один из способов ее обработки. Приведите примеры, когда хранение информации можно рассматривать как один из способов использования информации.
Кодирование информации
Информационный процесс кодирования информации встречается в нашей жизни на каждом шагу. Любое общение между людьми происходит именно благодаря тому, что они научились выражать образы, чувства и эмоции с помощью специально предназначенных для этого знаков и сигналов — звуков, жестов, букв и пр.
Одну и ту же информацию мы можем выразить разными способами.
Пример. Каким образом можно сообщить об опасности?
- Если на вас напали, вы можете просто крикнуть «Караул!» (англичанин крикнет «Help me!»).
- Если имеется прибор под высоким напряжением, то требуется оставить предупреждающий знак (рисунок черепа или молнии).
- На оживленном перекрестке регулировщик помогает избежать аварии с помощью жестов.
- Если ваш корабль тонет, то вы передадите сигнал «SOS» (• • • - - - • • •); для этих целей на флоте могут использовать также семафорную и флажковую сигнализацию.
В каждом из этих примеров необходимо знать правило, по которому отображается информация, правило кодирования. Такое правило назовем кодом.
Код (фр. code — кодекс, свод законов). Начиная с середины XIX века это слово, помимо основного значения, означало книгу, в которой словам естественного языка сопоставлены группы цифр или букв.
Чаще всего кодирование — это процесс, представления информации в виде знаков (поскольку дискретные сигналы воспринимать и обрабатывать проще, чем непрерывные).
Знак вместе с его смыслом называют символом.
Описание фильма №1
Время: около 3 мин.
Мужской голос за кадром. Большинство из вас видело фильм «Титаник» и помнит эти кадры (начиная с кадров, когда корабль уходит под воду, в ускоренном режиме назад схематично проматывается фильм до сцены, где радист передает сигнал SOS). Думаю, что многие из книг и фильмов знают, что означает аббревиатура SOS. Это сигнал бедствия. Но во времена Титаника не было устройств, позволяющих передавать без проводов голосовые сообщения на большие расстояния. Поэтому применяли телеграф. Как же с его помощью передавали информацию?
Для ответа на этот вопрос рассмотрим устройство, при помощи которого передавали. Как вы видите, оно представляет собой простую конструкцию: нажимая на рукоятку, мы замыкаем контакт и в радио эфир вылетает короткий сигнал – точка, говоря на языке телеграфистов. Ровно такое же время мы можем не нажимать на рычаг, и тогда для телеграфиста это будет означать другой сигнал – паузу. Если же мы в течение утроенного времени не будем нажимать, то получим еще один сигнал – тире. Таким образом, при помощи точек, тире и пауз между ними, которые все вместе образуют правило кодирования, телеграфисты кодировали любую текстовую и числовую информацию. Взгляните на алфавит азбуки Морзе (демонстрируется на экране), названной так в честь ее изобретателя.
Под алфавитом мы подразумеваем используемый для кодирования конечный набор отличных друг от друга знаков. В нашем случае их всего два: точка и тире.
Радиосигнал бедствия кодируется так: •••---•••. Конец фильма.
Используемый для кодирования конечный набор отличных друг от друга знаков называется алфавитом.
Существует множество алфавитов.
- алфавит кириллических букв {А, Б, В, Г, Д, Е, ...};
- алфавит латинских букв {А, В, С, D, Е, F, ...};
- алфавит десятичных цифр {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};
- набор знаков азбуки Брайля для слепых;
- набор китайских идеограмм;
- математическая символика {≈, ≠, Σ, ~, ±} и др.;
- набор знаков генетического кода {А, Ц, Г, Т}.
Важнейшие технические коды для кодирования текстов, записанных на естественных языках, возникли с появлением электрического телеграфа, например:
- азбука Морзе;
- набор знаков второго международного телеграфного кода (телекс).
При кодировании информации для технических устройств особенно важное значение имеют наборы, состоящие всего из двух знаков: {+, -}; {•, -}; {0, 1}; {да, нет}.
Алфавит, состоящий из двух знаков, называют двоичным, а каждый знак из этого алфавита — двоичным знаком.
Кодирование используется для представления информации в виде, удобном для хранения и передачи. Рассмотрим простейшие задачи кодирования и декодирования.
Пример. Попробуем закодировать числа от 0 до 100, не используя арабских или римских цифр.
Прежде всего, необходимо придумать алфавит или выбрать какой-либо из известных.
Можно ли использовать в качестве «букв» алфавита знаки {*, +, !, #, & }; {∆, □, О} или гласные буквы русского алфавита?
Да, можно выбрать любой набор отличающихся друг от друга знаков.
Каждому числу, которое нужно закодировать, поставим в соответствие одну «букву» выбранного нами алфавита. Например:
Числа | 1 алфавит | 2 алфавит | 3 алфавит |
0 | * | ∆ | а |
1 | + | □ | е |
2 | ; | о | ё |
3 | # | | и |
4 | & | | 0 |
5 | | | у |
6 | | | ы |
7 | | | э |
8 | | | ю |
9 | | | я |
10 | | | |
Во всех трех случаях из приведённого примера мы не решили поставленной задачи. Мы не смогли закодировать числа от 0 до 100, используя предложенные алфавиты. Получается, что наш алфавит обязательно должен состоять из 101 знака? Но с помощью всего десяти арабских цифр вы можете записать любое число. А римских цифр для кодирования первых 101 числа требуется всего пять: I, V, X, L, С.
Нужен другой подход, другое правило.
Покажем, что используя всего три символа, например {∆, □, О}, можно закодировать (зашифровать, представить) любое число. Для этого каждое число будем представлять не одним, а несколькими символами из нашего алфавита.
В нашем правиле кодирования появляется понятие «длина кода».
Длиной кода назовем количество знаков, которое используется для представления кодируемого числа (или слова).
То есть термин «код» используется в двух смыслах — как правило кодирования и как набор знаков для кодирования некоторого символа.
Количество знаков в алфавите кодирования и длина кода — совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3, ... буквы.
Посмотрим, сколько чисел мы можем закодировать, если длина кода составляет не более 2 знаков.
В
∆∆ ∆□ ∆о □∆ □□ □о о∆ о□ оо
□о∆ □о□ □оо
оспользуемся правилом, схематично представленным на рисунке.
0 | ∆ |
1 | □ |
2 | о |
3 | ∆∆ |
4 | ∆□ |
5 | ∆о |
6 | □∆ |
7 | □□ |
8 | □о |
9 | о∆ |
10 | о□ |
11 | оо |
12 | ∆∆∆ |
13 | ∆∆□ |
Если посмотреть на схему, то видно, что на первое место в каждом коде ставится код предыдущего уровня, а к нему дописываются по одному все знаки алфавита в заданном алфавитном порядке. Такое правило кодирования позволяет перебрать все возможные коды и никогда не повториться.
Из таблицы видно, что при длине кода не более 2 знаков всего можно закодировать 12 (3 + 9) разных чисел. Чтобы закодировать числа 12, 13, ..., следует увеличить длину кода.
Пример. Рассмотрим задачу, обратную к задаче кодирования из предыдущего примера. Есть закодированная информация: □о∆. Коды вам известны. Длина кода — не более 2 знаков. Определите исходное число. Так как длина кода может быть 1 или 2, то
- могли быть закодированы три числа — 1, 2, 0;
- могли быть закодированы два числа — 1, 9;
- могли быть закодированы два числа — 8, 0.
Все три решения справедливы. Как вы думаете; почему? Есть ли способ, который приведет нас к однозначному решению поставленной задачи?
Коды переменной (непостоянной) длины в технике встречаются довольно редко. Исключением является лишь код Морзе.
Пример. Взгляните на международную азбуку Морзе:
A | ●- | J | ●--- | S | ●●● |
B | -●●● | K | -●- | T | - |
C | -●-● | L | ●-●● | U | ●●- |
D | -●● | M | -- | V | ●●●- |
E | ● | N | -● | W | ●-- |
F | ●●-● | O | --- | X | -●●- |
G | --● | P | ●--● | Y | -●-- |
H | ●●●● | Q | --●- | Z | --●● |
I | ●● | R | ●-● | | |
Для отправителя приведенная таблица выглядит вполне логично, ибо буквы в ней расположены в алфавитном порядке. Но для человека, получающего сообщения, она неудобна. В каком же порядке следует расположить знак азбуки Морзе, чтобы, получив сигнал, мы могли, не теряя времени, определить, какой букве он соответствует? Представим азбуку Морзе в виде дерева.
При получении сигнала — это либо точка, либо тире — записываем букву и спускаемся по дереву: если точка — влево от текущей вершины, если тире — вправо, если пауза — записываем букву текущей вершины, если длинная пауза — записываем букву и отмечаем конец слова.
По общепринятому правилу радистов продолжительность передачи точки равна продолжительности паузы, продолжительность передачи тире равна продолжительности передачи трех точек, продолжительность передачи пропуска (между буквами) равна продолжительности трех пауз.
Азбука Морзе — это пример троичного кода с набором знаков «точка», «тире», «пауза». Паузу в качестве разделителя между буквами и словами необходимо использовать, так как длина кода непостоянна.
В кодах с постоянной длиной закодированные символы могут следовать друг за другом непосредственно, без всяких разделителей. Местоположение этих символов устанавливается с помощью отсчета. И таким образом сообщение может быть раскодировано однозначно.
Наиболее простым для кодирования является двоичный алфавит. Чем меньше знаков в алфавите, тем проще должна быть устроена «машина» для распознавания (дешифровки) информационного сообщения. Однако чем меньше знаков в алфавите, тем большее их количество (большая длина кода) требуется для кодирования информации.
Вернемся к примеру с кодированием чисел. Будем использовать для представления (кодирования) чисел от 0 до 100 алфавит {∆, □, О} и код постоянной длины. Какова должна быть длина кода?
В случае, когда длина кода равна n, с помощью алфавита, состоящего из 3 знаков, можно закодировать 3n различных состояний (чисел, букв, комбинаций). Приведем одно из возможных объяснений. В каждой из n позиций может стоять один из 3-х знаков алфавита. Для первой позиции существует 3 возможности, Для каждой из этих возможностей рассмотрим 3 возможности для второй позиции — всего будем иметь 3*3 = 9 возможностей. Рассуждая далее аналогично для остальных позиций, получим 3*3*3*...*3 = 3n возможностей (комбинаций, состояний) расположения 3-х знаков в п позициях. Знаками двоичного алфавита можно закодировать 2n различных состояний; если имеется алфавит, состоящий из k знаков, то можно закодировать kn различных состояний.
Итак, если алфавит состоит из k знаков и используется код с постоянной длиной п, то можно закодировать М = kn различных состояний.
Пример. Определим, какой длины должен быть код, чтобы, используя разные алфавиты, закодировать 10, 33, 100, 200, 1000 различных символов. Проанализируйте таблицу:
Количество знаков | Длина кода | Максимальное коли- | Минимальная длина кода | Решение задачи | |
в алфавите | | чество символов, которое можно закодировать | для кодирования 200 разных символов | Количество символов | Длина кода |
2 | 1 | 21 = 2 | 27= 128 — мало | 10 | 4 |
| 2 | 22 = 4 | 28 = 256 — достаточно | 33 | 6 |
| 3 | 23 = 8 | | 100 | 7 |
| … | … | Ответ: 8 | 200 | 8 |
| п | 2n | | 1000 | 10 |
3 | 1 | 31 = 3 | 34= 81 —мало | 10 | 3 |
| 2 | 32 = 9 | З5 = 243 — достаточно | 33 | 4 |
| 3 | 33 = 27 | | 100 | 5 |
| … | … | Ответ: 5 | 200 | 5 |
| п | 3n | | 1000 | 7 |
4 | 1 | 41 = 4 | 43= 64 — мало | 10 | 2 |
| 2 | 42= 16 | 44 = 256 — достаточно | 33 | 3 |
| 3 | 43 = 64 | | 100 | 4 |
| … | … | Ответ: 4 | 200 | 4 |
| п | 4n | | 1000 | 5 |
k | 1 | k1 | Пусть k = 60 | 10 | 1 |
| 2 | k2 | 60'= 60 — мало | 33 | 1 |
| 3 | k3 | 60 2 = 3600 — достаточно | 100 | 2 |
| … | … | | 200 | 2 |
| л | kn | Ответ: 2 | 1000 | 2 |
Итак, для кодирования М различных символов кодом постоянной длины с помощью алфавита из k знаков, требуется длина кода (с учетом того, что длина кода — это целое число), равная
п = [logk М + 1] .
Передача сообщений всегда осуществляется во времени. Процесс кодирования также требует определенного количества времени, которым зачастую нельзя пренебрегать. При кодировании могут ставиться определенные цели и применяться различные методы. Наиболее распространенные цели кодирования:
- экономность (уменьшение избыточности сообщения, повышение скорости передачи или обработки);
- надежность (защита от случайных искажений);
- сохранность (защита от нежелательного доступа к информации);
- удобство физической реализации (двоичное кодирование информации в ЭВМ);
- удобство восприятия (схемы, таблицы).
В вычислительной технике для кодирования информации используется двоичный алфавит {0,1}. Это позволяет использовать достаточно простые устройства для представления и автоматического распознавания (дешифровки, декодирования) программ и данных. Конструкция декодирующего устройства максимально упрощается, ведь оно должно уметь различать всего два состояния (например, 1 — есть ток в цепи, 0 — тока в цепи нет). По этой причине двоичная система и нашла такое широкое применение.
Наиболее распространенными кодами являются ASCII (American standard code for information interchange — американский стандартный код для обмена информацией), ДКОИ-8, Winl251.
Одно и то же сообщение можно закодировать разными способами, то есть выразить на разных языках. В процессе развития человеческого общества люди выработали большое число языков кодирования. К ним относятся:
- разговорные языки (русский, английский, хинди и др., всего более 2000);
- язык мимики и жестов;
- язык рисунков и чертежей;
- языки науки (языки математики, химии и т. д.);
- языки искусства (языки музыки, живописи, скульптуры);
- специальные языки (эсперанто, морской семафор, азбука Морзе, азбука Брайля для слепых и т. д.);
Среди специальных языков особо выделим языки программирования.
Программирование — кодирование информации на языке, «понятном» компьютеру.
Задачи, связанные с кодированием и декодированием сообщений, изучаются в теории кодирования — одном из разделов теории информации.
Знать
Знак вместе с его смыслом называют символом. Используемый для кодирования конечный набор отличных друг от друга знаков называется алфавитом.
Алфавит, состоящий из двух знаков, называется двоичным алфавитом.
Кодированием называется процесс преобразования одного набора знаков в другой набор знаков.
Кодом называется правило для преобразования одного набора знаков в другой набор знаков.
Кодирование используется при хранении, передаче информации, представлении ее на носителе.
Длиной кода называется количество знаков, которое используется для представления кодируемого символа.
Код может быть постоянной и переменной длины.
Если длина кода равна п, то с помощью алфавита, состоящего из k знаков, можно закодировать М = kn различных состояний.
Для кодирования М различных состояний кодом постоянной длины с помощью алфавита из k знаков, требуется длина кода, равная п = [ logk M +1].
В вычислительной технике в настоящее время широко используется двоичное кодирование с алфавитом {0,1}. Наиболее распространенными кодами являются ASCII, ДКОИ-8, Winl251.
Интересный факт
В 1977 году математики Р. Ривест, А. Шамил и Л. Эдел-ман зашифровали фразу из нескольких слов, используя комбинацию из 129 цифр. Они утверждали, что на разгадку понадобятся триллионы лет. Однако ключ к самому сложному в мире шифру «РСА-129» был найден за 17 лет. Над дешифровкой работали 600 ученых и добровольцев на пяти континентах при помощи 1600 компьютеров. Сложность шифра заключалась в том, что для его разгадки было необходимо определить две группы простых чисел, которые при перемножении давали код «РСА-129». Зашифрованной оказалась бессмысленная фраза «волшебные слова — щепетильная скопа» (скопа — это хищная птица, живущая у водоемов и питающаяся рыбой). Эти слова были наугад выбраны из словаря в 1977 году. «Такие шифры необходимы, если вы хотите сохранить в секрете рецепт приготовления «Кока-колы» или формулы создания ядерного оружия», — сказал Р. Ривест на пресс-конференции в 1994 году. Возможность разгадки шифра за такой относительно короткий срок должны принять к сведению государственные организации и предприниматели, которые пользуются аналогичными длинными цифровыми кодами для защиты секретных сведений в своих компьютерных базах данных.
Хранение информации
Сбор информации не является самоцелью. Чтобы полученная информация могла использоваться, причём многократно, необходимо её хранить.
Хранение информации — процесс такой же древний, как и существование человеческой цивилизации. Он имеет огромное значение для обеспечения поступательного развития человеческого общества (да и любой системы), многократного использования информации, передачи накапливаемого знания последующим поколениям.
Уже в древности человек столкнулся с необходимостью хранения информации. Доказательствами тому служат зарубки на деревьях, помогающие не заблудиться во время охоты; счёт предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер.
Сооружения, предметы изобразительного искусства, глиняные таблички, записи, книги, архивы, библиотеки, аудиозаписи, кинофильмы — всё это служит целям хранения информации.
Различная информация требует разного времени хранения:
- автобусный билет требуется хранить только в течение поездки;
- программу телевидения — неделю;
- школьный дневник — учебный год;
- аттестат зрелости — до конца жизни;
- исторические документы — несколько столетий.
В живой природе и жизни человека процесс длительного хранения информации играет большую роль и подвергается постоянному совершенствованию.
Пример. Благодаря генетической информации, которая хранится в виде генов — участков молекулы дезоксирибонуклеиновой кислоты (ДНК), существует непрерываемая смена поколений каждого рода живых существ. Любой живой организм при рождении получает на клеточном уровне от своих родителей генетическую информацию и передает её своим детям. Генетическая информация определяет, каким будет каждый рождающийся организм, его принадлежность к определённому роду и виду.
Пример. Человеческое общество способно бережно хранить информацию и передавать её от поколения к поколению. На протяжении всей истории знания и жизненный опыт отдельных людей накапливаются. По современным представлениям, чем больше информации накоплено и используется в обществе, тем выше уровень его развития. Накопление информации является основой развития общества.
Основное хранилище информации для человека — его память, в том числе генетическая. Существует и «коллективная память» — традиции, обычаи того или другого народа.
Когда объём накапливаемой информации возрастает настолько, что её становится просто невозможно хранить в памяти, человек начинает прибегать к помощи различного рода вспомогательных средств (узелков «на память», записных книжек и т. д.).
С рождением письменности возникло специальное средство фиксирования и распространения информации в пространстве и во времени. Родилась документированная информация — рукописи и рукописные книги, появились своеобразные информационно-накопительные центры — древние библиотеки и архивы. Постепенно письменный документ стал и орудием управления (указы, приказы, законы).
Следующим информационным скачком явилось книгопечатание. С его возникновением наибольший объём информации стал храниться в различных печатных изданиях, и для её получения человек обращается в места их хранения (библиотеки, архивы и пр.).
В настоящее время мы являемся свидетелями быстрого развития новых, автоматизированных методов хранения информации с помощью электронных средств.
Компьютер и средства телекоммуникации предназначены для компактного хранения информации с возможностью быстрого доступа к ней.
Информация, предназначенная для хранения и передачи, как правило, представлена в форме документа.
Под документом понимается информация на любом материальном носителе (глиняные дощечки, бумага, киноплёнка, магнитная лента, компакт-диск и т. д.), предназначенная для распространения в пространстве и времени (от лат. dokumentum — свидетельство. Первоначально это слово обозначало письменное подтверждение правовых отношений и событий).
Основное назначение документа заключается в использовании его в качестве источника информации при решении различных проблем обучения, управления, науки, техники, производства, социальных отношений.
Разумеется, чтобы этой информацией можно было воспользоваться, она должна быть формализована по определённым правилам, то есть, представлена в наиболее удобном для пользователей виде.
Одной из процедур хранения информации является её накопление. Оно может быть пассивным и активным.
При пассивном накоплении поступающая информация просто «складируется», при этом принимаются меры для обеспечения её сохранности и повторного обращения к ней (считывания).
Пример. К пассивному накоплению информации относятся:
- запись звуковой информации на магнитофонную ленту;
- стенографирование выступления;
- размещение документов в архиве.
При активном накоплении происходит определённая обработка поступающей информации, имеющая много градаций, но в целом направленная на обогащение знания получателя информации.
Пример. К активному накоплению информации можно отнести:
- разбиение сообщения на отдельные сигналы;
- анализ содержания документов и построение аннотаций к ним;
- систематизацию и обобщение документов, поступивших на хранение;
- перевод содержания документов в другую форму;
- перенесение документов на другие носители совместно с процедурами сжатия данных, обеспечения их защитными кодами.
Хранение очень больших объёмов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме. Иными словами, информация хранится только для того, чтобы впоследствии её можно было легко отыскать, а возможность поиска закладывается при определении способа хранения информации и доступа к ней.
То есть первый вопрос, на который необходимо ответить при организации любого хранилища информации, — как её потом там искать.
Информационно-поисковая система (ИПС) — это хранилище информации, снабжённое процедурами ввода, размещения, поиска и выдачи информации. Наличие таких процедур — главная особенность ИПС, отличающая их от простых скоплений информационных материалов.
Пример. Личная библиотека, в которой может ориентироваться только её владелец, информационной системой не является. В публичных же библиотеках порядок размещения книг всегда строго определённый. Благодаря ему поиск и выдача книг, а также размещение новых поступлений представляет собой стандартные, формализованные процедуры. То же самое справедливо и для компьютерных ИПС.
Все хранимые в ИПС документы индексируются, то есть каждому документу (статье, протоколу, видеокассете) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск в хранилищах идёт не по самим документам, а по их поисковым образам, которые могут включать в себя:
- название документа;
- время и место создания;
- фамилии авторов или название организации, создавшей документ;
- тематические разделы, к которым можно отнести документ по его содержанию;
- информацию о местонахождении документа в хранилище и многое другое.
На рис. показано функционирование ИПС.
Документы
Запросы
Блок индексирования документов
Блок формирования поисковых запросов
Блок записи документов
Блок индексирования запросов
Блок формирования поисковых образов документов
Поисковая система
Информационная база данных
Ответы
Развитие информатики постоянно раздвигает границы возможностей накопления и хранения информации с применением компьютеров и компьютерных сетей.
Одна из важных задач автоматизированного хранения — это преобразование формы информации из физических сигналов в «знаковую» форму и обратно, а также сжатие информации, то есть устранение избыточности в её представлении.
Знать
Хранение информации необходимо для распространения её во времени.
Хранилище информации зависит от её носителя (книга — библиотека, картина — музей, фотография — альбом). Основные хранилища информации:
- для человека — память, в том числе генетическая;
- для общества — библиотеки, видеотеки, фонотеки, архивы, патентные бюро, музеи, картинные галереи.
Компьютерные хранилища: базы и банки данных, информационно-поисковые системы, электронные энциклопедии, медиатеки и т. п.
Информация, предназначенная для хранения и передачи, как правило, представлена в форме документа.
Под документом понимается информация на любом материальном носителе, предназначенная для распространения в пространстве и времени.
Основное назначение документа заключается в использовании его в качестве источника информации при решении различных проблем обучения, управления, науки, техники, производства, социальных отношений.
Хранение очень больших объёмов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.
Информационно-поисковая система (ИПС) — это хранилище информации, снабжённое процедурами ввода, размещения, поиска и выдачи информации.
Все хранимые в ИПС документы индексируются, то есть каждому документу присваивается индивидуальный код, составляющий поисковый образ документа. Поиск в хранилищах идёт не по самим документам, а по их поисковым образам.
Важной задачей автоматизированного хранения является преобразование формы информации из физических сигналов в «знаковую» форму и обратно, а также сжатие информации, то есть устранение избыточности в её представлении.
Интересный факт
Знаете ли вы, что Windows 3.1 занимает на диске около 15 Мб, Windows 95 — уже 30-60 Мб. 10 секунд музыки требуют» 1 Мб, а 10 секунд видео — 15 Мб?
Знаете ли вы, что деловая Европа ежедневно создаёт 600 млн страниц распечаток, 230 млн фотографий, 75 млн писем и 24 млн документов, а затраты на обработку, хранение и поиск документов достигают 100 миллиардов долларов в год?
Исследования в 1990 году показали, что 92% всей деловой информации тогда хранилось на бумаге, лишь 1% — на магнитных дисках, 2% — на магнитных лентах и 5% — с помощью микрофильмов. Но мир электронных документов развивается динамичнее, чем мир бумажных документов. По оценкам специалистов с 1995 по 2005 годы общее число используемых бумажных документов увеличилось только вдвое, тогда как количество электронных документов удваивалось ежегодно. Соотношение бумажных и электронных документов такое: в 2005 году на бумаге осталось лишь треть всех документов.
Передача информации
Хранение информации необходимо для распространения её во времени, а её распространение в пространстве происходит в процессе передачи информации.
Практически любая деятельность людей связана с общением (человек — существо общественное), а общение невозможно без передачи информации.
В процессе передачи информации обязательно участвуют источник и приёмник информации: первый передает информацию, второй её принимает. Между ними действует канал передачи информации — канал связи. Передача информации возможна с помощью любого языка кодирования информации, понятного как источнику, так и приёмнику.
Кодирующее устройство — устройство, предназначенное для преобразования исходного сообщения источника информации к виду, удобному для передачи.
Декодирующее устройство — устройство для преобразования кодированного сообщения в исходное.
Пример. При телефонном разговоре:
источник сообщения — говорящий человек;
кодирующее устройство — микрофон — преобразует звуки слов (акустические волны) в электрические импульсы;
канал связи — телефонная сеть (провод);
декодирующее устройство — та часть трубки, которую мы подносим к уху, здесь электрические сигналы снова преобразуются в слышимые нами звуки;
приёмник информации — слушающий человек.
Пример.
И царица над ребёнком, Как орлица над орлёнком; Шлёт с письмом она гонца, Чтоб обрадовать отца | Источник информации — царица; кодирование информации — написание письма; канал связи — гонец |
А ткачиха с поварихой, С сватьей бабой Бабарихой Извести её хотят, Перенять гонца велят | Помехи |
Сами шлют гонца другого Вот с чем от слова до слова,.. | Искажение информации |
Как услышал царь-отец, Что донёс ему гонец... | Декодирование информации — чтение письма; приёмник информации — царь Салтан |
В процессе передачи информация может теряться и искажаться: искажение звука в телефоне, атмосферные помехи, влияющие на работу радиоприёмника, искажение или затемнение изображения в телевизоре, ошибки при передаче по телеграфу. Эти помехи, или, как их называют специалисты, шумы, искажают информацию. К счастью, существует наука, разрабатывающая способы защиты информации — криптология, широко применяющаяся в теории связи. И если бы пушкинская царица её знала, то вряд ли князь Гвидон нашел бы Царевну-лебедь.
Информацию передают друг другу не только люди, но и животные и растения.
Пример. В жаркой Индии по берегам рек растут густые заросли растения под названием стыдливая мимоза. Когда начинается тропический ливень, стыдливая мимоза спешит свернуть свои листочки, спасая их от сильных струй. Но самое интересное состоит в том, что, как только первые капли дождя упадут хотя бы на одно из растений, сигнал о наступающем дожде начинает передаваться от ветки к ветке, и все растения длинной цепи зарослей сворачивают свои листья.
Человечество придумало много устройств для быстрой передачи информации: телеграф, радио, телефон, телевизор. К числу устройств, передающих информацию с большой скоростью, относятся телекоммуникационные сети на базе вычислительных систем.
Пример. «Поболтать» с другом по электронной почте или в режиме телеконференции в сети Интернет становится для многих вполне привычным делом. А темпы компьютеризации всех сфер жизни таковы, что будет совсем неудивительно, если лет через пять общение с помощью телекоммуникационных сетей будет таким же обычным и совершенно необходимым действием, каковым сейчас является общение по телефону.
Для передачи разнообразной информации в рамках общества созданы средства массовой информации (газеты, журналы, радио, телевидение). Благодаря передаче информации, общество организует совместные действия своих членов.
Передача информации может идти по схемам: «от одного к одному», «от многих к одному», «от одного ко многим» (см. рис.).
Рис. Различные способы передачи информации
Несколько процессов передачи информации могут образовывать составной информационный процесс, который называют обменом информацией.
Обмен информацией — это процесс передачи информации между двумя или несколькими объектами, при котором каждый объект и получает, и выдает информацию.
Схема обмена информацией для двух объектов А и В имеет вид, представленный на рис.
Передача информации — это реальный физический процесс, протекающий в среде, разделяющей источник и получатель. Передаваемая информация имеет определённую форму, которая чаще всего выглядит как последовательность сигналов, каждый из которых переносит элементарную порцию информации. В теории связи эта последовательность сигналов называется сообщением.
Следует различать сообщение и заключённую в нём информацию (смысл сообщения для источника и получателя). Одна и та же последовательность сигналов может нести для разных получателей различную информацию.
В процессе передачи сигналов важная роль принадлежит каналам связи и их свойствам.
Физическая природа каналов связи может быть самая разнообразная: воздух и вода, проводящие акустические волны и радиоволны, токопроводящие среды (система металлических проводов), оптоволоконные среды.
Каналы связи делятся на симплексные (с передачей информации только в одну сторону (телевидение)) и дуплексные, по которым возможно передавать информацию в оба направления (телефон, телеграф). По каналу могут одновременно передаваться несколько сообщений. Каждое из этих сообщений выделяется (отделяется от других) с помощью специальных фильтров. Например, возможна фильтрация по частоте передаваемых сообщений, как это делается в радиоканалах.
Каналы связи характеризуются пропускной способностью и помехозащищённостью.
Пропускная способность канала определяется максимальным количеством символов, передаваемых по нему в отсутствие помех. Эта характеристика зависит от физических свойств канала.
Для повышения помехозащищённости канала используются специальные методы передачи сообщений, уменьшающие влияние шумов. Например, при передаче вводятся лишние (избыточные) символы, не несущие содержания, но использующиеся для контроля правильности сообщения при получении.
Знать
Передача информации необходима для распространения её в пространстве.
В процессе передачи информации обязательно участвуют источник и приёмник информации: первый передает информацию, второй её получает. Между ними действует канал передачи информации — канал связи, обеспечивающий передачу сигналов от источника к приемнику.
Канал связи характеризуется пропускной способностью и помехозащищённостью.
Кодирующее устройство — устройство, предназначенное для преобразования исходного сообщения источника информации к виду, удобному для передачи.
Декодирующее устройство — устройство для преобразования кодированного сообщения в исходное.
Схема передачи информации изображена на рис.