«Информация»

Вид материалаРеферат

Содержание


Количество информации
Что такое информация?
Компьютеризация общества.
Интерпретация данных
Форма представления данных.
Хранение, кодирование и преобразование данных.
Задача резервирования
Лазерные диски
Магнитооптические диски
Сменные магнитные диски
Использование программ архивации
Динамическое сжатие данных
Подобный материал:
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)


Реферат на тему:

«Информация»


Исполнитель: Чернышев Д.В.

Группа: ПКИ-1-99

Преподаватель: Шемакин Ю.И.


Москва 2002

Содержание.


Информация 3

Количество информации 4

Что такое информация? 4

Компьютеризация общества. 5

Интерпретация данных 6

Хранение, кодирование и преобразование данных. 9

Задача резервирования 11

Магнитооптические диски 12

Сменные магнитные диски 13

Использование программ архивации 14

Динамическое сжатие данных 14

Выводы 15



Информация



Накопление человечеством опыта и знаний при освоении природы смешалось с освоением информации. Именно этот процесс и привёл к образованию инфосферы.

Информация в переводе с латинского языка означает: разъяснение, изложение чего-либо или сведения о чём-либо. Такое понятие, как обработка информации, появилось совсем недавно, но обрабатывать информацию люди начали ещё в древние времена.

Сначала из поколения в поколение информация передавалась устно. Это были сведения о профессиональных навыках, например о приёмах охоты, обработки охотничьих трофеев, способах земледелия и др. Но затем информацию стали фиксировать в виде графических образов окружающего мира. Так, первые наскальные рисунки, изображающие животных, растения, людей, появились примерно 20-30 тыс. лет назад.

Начатый поиск более современных способов фиксирования информации привёл к появлению письменности. Вначале люди записывали расчёты с по­купателями, а затем написали и первое слово. На чём только они не писали! В Индии - на пальмовых листьях, в Вавилоне - на глиняных плитках, на Руси пользовались берестой. Как видим, письменность - новый шаг человечества в области хранения и передачи информации. Однако первым революционным явлением в этой сфере стало изобретение печатного станка, благодаря которому появилась книга и, таким образом стало возможно массовое тиражирование профессиональных знаний, зафиксированных на материальном носителе.

Сегодня потоки книг, сливаясь с потоками технической документации и многотомной справочной литературой, образуют океаны информации. Эту информацию необходимо хранить и передавать потребителю, для чего нужен мобильный и ёмкостный носитель.

Но книга является неудобным, сложным, дорогим, а главное "медленным" носителем информации. Вся многогранность содержания раскрывается человеку при перелистывании, чтении и рассматривании книги. Таким образом, она не может непосредственно влиять на производственный процесс. Сначала человеку необходимо найти нужную ему книгу, освоить накопленные в ней знания, которые позже смогут дать толчок дальнейшему развитию производства. Хранение книг требует громадных знаний и специальных климатических условий, а их доставка потребителю сопряжена с дорогостоящим размножение во множестве экземпляров и объёмными транспортными перевозками. Книга как носитель информации сегодня уже отстаёт от стремительного продвижения человечества по пути освоения природы. Прогресс в этой деятельности, обусловленный в первую очередь развитием коммуникаций, т.е. связью между людьми, требует расширения влияния инфосферы на техносферу.

Был и другой вид информационной деятельности. Отдельные государства, стремясь к расширению своих территорий, проводили агрессивную политику по отношению к своим соседям. Подготовка и ведение боевых действий требовали информации о военном потенциале противника. Её добывали, например, через разведчиков. Тогда остро встал вопрос о защите информации от утечки в посторонние руки. Стали развиваться методы кодирования, разрабатываться способы быстрой и безопасной пересылки информации. Шли годы, рос объем информации, которой обменивалось общество. Для сбора, переработки и распространения информации создавались издательства, типографии - родилась информационная промышленность. Газеты, журналы и другие издания, выпускающиеся большими тиражами, кроме полезной информации обрушивали на человека огромное количество зачастую и ненужных, бесполезных сведений. Для обозначения таких лишних сведений придумали специальный термин "информационный шум".

Помимо печати появились и другие органы массовой информации - радио и телевидение. И общество привыкло к тому, что когда говорят об информации, то речь идёт о сведениях, полученных через радио, газеты и т.д. Затерялся основной смысл этого слова, утонул в потоке новостей, поступающих через органы массовой информации.

Второе революционное изобретение XX века - Электронная Вычислительная Машина (ЭВМ). Она-то и является носителем информации и средством доставки её потребителю. В совокупности с линиями связи, такими, как проводная, радио-, космическая и оптическая, ЭВМ делает человеку доступной и мобильной любую часть гигантского объёма информации, которая без непосредственного воздействия на человека может влиять на работу производственного оборудования, например на станки с программным управлением. На заводах внедряются автоматизированные линии и даже целые автоматизированные производства. Отсюда, конечно, не следует, что в будущем компьютер вытеснит из обихода книгу. Ведь книга не просто "носитель информации", она - часть нашего духовного мира. Уже сейчас, передавая информацию в машинную память, люди освобождают полки книжных хранилищ от технической документации и справочной литературы.

Количество информации



Информация - произвольная последовательность символов, т.е. любое слово, каждый новый символ увеличивает количеством информации. Как же измерить количество информации? Для этого, как впрочем и для измерения длины, массы и т.д. нужен эталон. Какое же слово взять в качестве эталона информации? Прежде, чем выбрать это слово необходимо выбрать алфавит материал, из которого будет сделано это слово. Обычно алфавит берут двухсимвольным. Например, он может состоять из цифр 1 и 0. Эталоном считается слово, состоящее из одного символа такого алфавита. Количество информации, содержащееся в этом слове принимают за единицу, названную битом. Имея эталон количества информации можно сравнить любое слово с эталоном. Проще сравнивать те слова, которые записаны в том же двухсимвольном алфавите.

Что такое информация?



Вообще существует несколько взглядов на то, что принято считать информацией. Один взгляд, и его, по-видимому придерживается большая часть специалистов и неспециалистов сводится к тому, что существует как бы два сорта информации:

1).Информация техническая, которая передаётся по телеграфным линиям и отображается на экранах радиолокаторов. Количество такой информации может быть точно вычислено, и процессы, происходящие с такой информацией, подчиняются физическим законам.

2). Информация семантическая, то есть смысловая. Это та самая информация, которая содержится, к примеру, в литературном произведении. Для такой информации предлагаются различные количественные оценки и даже строятся математические теории. Но общее мнение скорее сводится к тому, что оценки здесь весьма условны и приблизительны и алгеброй гармонию всё-таки не проверишь.

Второй взгляд состоит в том, что информация - это физическая величина, такая же, как, например, энергия или скорость. Определённым образом и в определённых условиях информация равным образом описывает как процессы, происходящие в естественных физических системах, так и процессы в системах, искусственно созданных.

Как всегда, при наличии двух резко противоположных мнений существует и третье, примиряющее. Сторонники третьего подхода считают, что информация едина, но вот количественные оценки должны быть разными. Отдельно нужно измерять количество информации, причём количество информации - строгая оценка, относительно которой можно развивать единую строгую теорию. Кроме количества информации, следует измерять ещё и ценность. А вот с ценностью информации происходит то же самое, что и с понятием семантической информации. С одной стороны, вроде её можно вычислить, а с другой стороны, все эти вычисления справедливы лишь в ограниченном числе случаев. И вообще, кто может точно вычислить, скажем, ценность крупного научного открытия?

Бурное развитие науки и промышленности в XX веке, неудержимый рост объёмов поступающей информации привели к тому, что человек оказался не в состоянии воспринимать и перерабатывать всё ему предназначенное. Возникла необходимость классифицировать поступления по темам, организовывать их хранение, доступ к ним, понять закономерности движения информации в различных изданиях и т.д. Исследования, позволяющие разрешить возникшие проблемы, стали называть информатикой.

Компьютеризация общества.



Единство законов обработки информации в системах различной природы (физических, экономических, биологических и т.п.) является фундаментальной основой теории информационных процессов, определяющей ее общезначимость и специфичность. Объектом изучения этой теории является информация - понятие во многом абстрактное, существующее "само по себе" вне связи с конкретной обла­стью знания, в которой она используется. Это обстоятельство накладывает определенный отпечаток на всю информатику как науку об организации компьютерных информационных систем, - такие системы могут использоваться в самых разных предметных областях, привнося в них "свои правила игры", свои закономерности, ограничения м вместе с тем новые возможности организации бизнеса, которые были бы немыслимы без информатики и связанного с ней компьютера. В этом плане невозможно переоценить такие свойства информации как доступность, своевременность получения, коммерческая ценность, надежность.

Информационные ресурсы в современном обществе играют не меньшую, а нередко и большую роль, чем ресурсы материальные. Знания, кому, когда и где продать товар, может цениться не меньше, чем собственно товар, и в этом плане динамика развития общества свидетельствует о том, что на "весах" материальных и информа­ционных ресурсов последние начинают превалировать, причем тем сильнее, чем более общество открыто, чем более развиты в нем средства коммуникации, чем большей информацией оно располагает. С позиций рынка информация давно уже стала товаром и это обстоятельство требует интенсивного развития практики, промышленности и теории компьютеризации общества. Компьютер как информационная среда не только позволил совершить качественный скачек в организации промышленности, науки и рынка, но он определил новые самоценные области производства: вычислительная техника, телекоммуникации, программные продукты. Тенденции компьютеризации общества связаны с появлением новых профессий, связанных с вычислительной техникой, и различных категорий пользователей ЭВМ. Если в 60-70е годы в этой сфере доминировали специалисты по вычислительной технике (инженеры-электроники и программисты), создающие новые средства вычислительной техники и новые пакеты прикладных программ, то сегодня интенсивно расширяется категория пользователей ЭВМ - представителей самых разных областей знаний, не являющихся специалистами по компьютерам в узком смысле, но умеющих использовать их для решения своих специфических задач.

Пользователь ЭВМ (или конечный пользователь) должен знать общие принципы организации информационных процессов в компьютерной среде, уметь выбрать нужные ему информационные системы и технические средства и быстро освоить их применительно к своей предметной области. Учитывая интенсивное развитие вычислительной техники и во многом насыщенность рынка программных продуктов, два последних качества приобретают особое значение. Минимум знаний по организации компьютерных систем обычно называют компьютерной грамотностью. Не существует строго очерченных рамок, определяющих это понятие, - каждый пользователь определяет их для себя сам, но вместе с тем отсутствие такой грамотности делает сегодня невозможным доступ ко многим узко специальным профессиям, на первый взгляд весьма далеким от компьютера.


Интерпретация данных



Зададимся вопросом, что такое данные и как мы к ним относимся? Интуитивно ясно, что под данными мы подразумеваем какое-либо сообщение, наблюдаемый факт, сведения о чем-либо, результаты эксперимента и т.п. Иначе говоря, данные -это всегда конкретность, представленная в определенной форме (числом, записью, сообщением, таблицей и т.д.). Сами по себе данные никакой ценности не представляют. На самом деле, как вы отнесетесь, например, к следующим данным:

(1) - "тридцать семь с половиной";

(2) - "2+2=4";

(3) - "Петров стал директором".

Первое вызовет недоумение, второе - ощущение тривиальности (это знает каждый), третье - размышления, кто такой Петров? Во всех приведенных примерах данные неинформативны (хотя по разным причинам), и для того, чтобы придать им информативность, т.е. превратить их в информацию, необходимо осуществить интерпретацию данных.

Интерпретация - процесс превращения данных в информацию, процесс придания им смысла. Этот процесс зависит от многих факторов: кто интерпретирует данные, какой информацией уже располагает интерпретатор, с каких позиций он рассматривает полученные данные и т.д. Процесс интерпретации может осуществляться человеком или группой лиц, при этом он может быть творческим (например, музицирование по нотной записи) или формальным (определение времени по часам). Такой процесс может осуществляться биологическими объ­ектами (условные рефлексы собак, общение дельфинов), многими устройствами технической автоматики (обнаружение сигнала от цели в радиолокации с последующими действиями) и, конечно, компьютером. Абстрактность информации в отличие от конкретности данных заключается в том, что процесс интерпретации в общем случае не может быть определен формально, в то время как данные всегда существуют в какой-то определенной форме. Между данными и информацией в общем случае нет взаимно-однозначного соответствия. Например, формально различные сообщения "до завтра" и "see you tomorrow" [1] несут одну и ту же информацию. Разные знаки "х" и "*" могут содержательно обозначать одно и то же - операцию умножения, формально различные строки "21" и "XXI" определяют одно и то же число (в различных системах счисления). С другой стороны одни и те же данные могут нести совершенно различную информацию разным получателям (разным интерпретаторам). Например, знак "I" может интерпретироваться как буква "ай" в английском алфавите или как римская цифра 1, знак "+" может интерпретироваться как операция сложения или операция объединения множеств в зависимости от контекста. Кивок головой сверху вниз обычно обозначает "Да", а покачивание - "Нет", но не во всех странах (в Болгарии и Греции это не так). На доске объявлений по размену квартир я увидел объявление со следующими данными: "(2+2)=(3+1)", что означало "Меняю две двухкомнатных на трехкомнатную и однокомнатную", - можно ли было бы предположить такую интерпретацию этих данных, например, в учебнике по арифметике? Эти примеры показывают, что интерпретация данных зависит от многих дополни­тельных объективных факторов (в этих примерах - контекст, страна, место), но интерпретация может зависеть и от субъективных факторов. Например, один и тот же цвет человек с нормальным зрением воспринимает одним образом, а дальтоник другим. Приведенные примеры альтернативной интерпретации одних и тех же данных иллюстрируют понятие полиморфизма (множественной интерпретации), которое в конечном счете и определяет абстрактный характер этого процесса.

Наконец, еще один важный аспект интерпретации. В любом достаточно большом наборе данных есть особые позиции (знаки, ключевые слова, признаки), которые управляют процессом интерпретации и потому имеют особое значение, во многом определяющее ценность и важность получаемой информации. Классический пример: сообщение "Казнить нельзя, помиловать". Положение запятой в этом примере (перед словом "нельзя" или после) радикально меняет информационное содержание данных. Можно ли в этом отношении сравнить запятую в этом сообщении с буквой "н", например? Потеря или искажение последней легко восстанавливается по контексту, потеря запятой сводит информативность сообщения в целом к нулю. Еще один пример. Допустим, вы располагаете следующим фрагментом таблицы:

Товар

Станок

Дрель

Фреза

Двигатель

Стоимость

757,7

123

78,5

356

Рис. 1.1


Потеря слова "Стоимость" во второй строке делает невозможной правильную интерпретацию числового материала всей таблицы, в то время как потеря слова "Товар" легко восстанавливается по контексту. Таким образом, данные - это набор неоднородных ключевых слов (позиций, знаков и т.п.), несущих информацию разной степени ценности.


Форма представления данных.


Основные виды восприятия данных человеком связаны с использованием зрительных образов, т.е. образов, воспринимаемых с помощью зрения. Все возрастающее значение имеет использование звуковых и тактильных образов (воспринимаемых осязанием). Обоняние и вкус в этом ряду стоят на последнем месте.

Зрительные образы существуют в двух основных формах: символьной и графической. Разумеется, каждая из них может использовать цвет. Символьная форма представления данных может быть определена как некоторый конечный набор изображающих знаков. Такой набор легко представить себе как совокупность ящиков, на каждом из которых изображен соответствующий знак и в котором лежит множество фишек - копий этого знака. Термин "конечный набор" означает здесь конечное число ящиков, - набор фишек в ящике не ограничен. Конструирование зрительного образа в символьной форме осуществляется путем размещения фишек в определенной плоской клеточной структуре, - строке, столбце, клеточном поле, кроссворде, игровом поле и т.п. В каждой клетке такой структуры может быть размещена только одна фишка набора. Разновидностью такого клеточного поля является и экран компьютера, работающего в режиме ввода символьных данных.

Символьная форма имеет множество разновидностей, среди них наиболее распространены языковая и табличная (псевдографическая).

Языковая форма обычно связывается с понятием алфавита как упорядоченного набора изображающих знаков, на основе которого конструируются фразы языка путем размещения изображающих фишек в структуре строки или столбца. В одних языках строка заполняется слева направо, в других справа налево (иврит, напри­мер), в третьих сверху вниз (по столбцу) и слева направо и т.д.

Отношения порядка в алфавите во многом условны, что нередко приводит к некоторым странностям. Например, система изображающих знаков (иероглифов) китайского языка не упорядочена, что формально не позволяет отнести его к языкам вообще. Поэтому во многих случаях алфавит рассматривают как синоним понятию "набор изображающих знаков", преднамеренно опуская отношения порядка в таком наборе.

В этой связи отметим, что иногда языковую форму называют текстовой, при этом понятие "текст" в широком смысле не требует никаких ограничений не только на набор изображающих знаков, но и на правила интерпретации текста. Любая информация, представленная в символьной форме может рассматриваться как текст.

Разумеется, разные языки могут иметь совершенно разные алфавиты, причем алфавит языка может расширяться путем введения в него новых изображающих знаков, интерпретируемых, например, как знаки препинания или реализующих новые шрифты.

Примеров языков очень много: кроме естественных языков (русский, английский и т.п.) это еще и языки представления чисел (арабских, римских, десятичных двоичных и т.д.), языки формул (алгебраических, химических и т.д.), язык описания шахматных партий, язык стенографии, языки программирования и т.д. Табличная форма может рассматриваться как специфическая разновидность языковой, которая позволяет конструировать разного рода бланки, таблицы, отчеты и т.п. В несколько упрощенном виде набор изображающих знаков для конструирования этой формы включает в себя следующие знаки:



На рис 1.1. приведен пример информационного образа в табличной форме, построенный с использованием этого набора знаков, языка представления десятичных чисел и русского языка. Иногда средства представления информации в табличной форме называют языками типа "заполни бланк" Графическая форма представления информации принципиально отличается от символьной тем, что в ней используется единственный вид изображающего символа - точка на плоскости, - все изображения объектов конструируются из точек. Любой зрительный образ, представленный в символьной форме, может быть представлен и в графической форме, - обратное в общем случае неверно. В этом смысле графическая форма представления данных более информативна, или, как говорят, обладает большей разрешающей способностью (большей информационной емкостью). При этом разрешающую способность формы следует понимать как возможность представления различных данных в единице изображающего поля (экрана компьютера). Если принять за такую единицу одну клетку (см. выше), то разрешающая способность будет определяться количеством возможных изображений в этой клетке. Для символьной формы - это число изобра­жающих символов алфавита, для графической - это число гораздо больше.

Например, для черно-белого изображения и размеров клетки 8х8 (точек) число всех возможных изображений в ней определяется величиной 264.

В отдельных случаях при определенном наборе изображающих символов символьная форма позволяет представлять простые графические образы. В частности, контуры таблицы рис. 1.1. "похожи на графику". Поэтому такие специфические виды символьного представления данных называют псевдографикой, хотя на самом деле ничего общего с графикой они не имеют. Как графическая, так и символьная форма могут использовать цвет, - при этом изображающие знаки приобретают дополнительное качество - иметь цвет. Это обстоятельство в общем случае существенно повышает информационную емкость зрительных образов для любой формы представления данных. Но применительно к графической форме на компьютерах с хорошими дисплеями (с высокой разрешающей способностью) цветность обеспечивает качественно новые возмож­ности обработки графической информации, - например, создание и демонстрация цветных видеофильмов на компьютере. Обсуждаемые формы представления данных предназначены для создания информационных зрительных образов на плоскости и широко используются в компьютере, поскольку экран дисплея может рассматриваться как плоская поверхность. Объемные изображения представляются обычно в плоской графической форме на основе перспективы, с помощью различных сечений, проекций, методов проективной геометрии и т.п. Использование символьной и графической форм представления данных определяют два различных режима компьютера в задачах обработки информации. Эти режимы различаются не только представлением информации на экране монитора, но и в памяти компьютера и соответственно программными средствами, поддерживающими тот или иной режим. Например, символьный режим связан с хранением в памяти компьютера символов, а графический - пикселов (изображающих точек), что в общем случае требует значительно большего объема памяти. (Термин "pixel" произведен от английского "picture eleinent"). Для создания и изменения символьных образов (редактирования) используются программы, которые называют символьными редакторами (текстовыми редакторами), а графических образов - графическими редакторами. Наконец, символьная и графическая форма широко используются не только для представления зрительных образов, но также для звуковых и тактильных. Например, нотная запись и система фонем используются для представления и конструирования звуковых образов, а азбука Л.Брайля - для представления тактильных образов, воспринимаемых осязанием.

Азбука Л.Брайля - это рельефно-точечный шрифт для чтения слепых. В основе такого шрифта лежит комбинация из 6 точек, дающая возможность обозначать буквы, цифры, знаки препинания, математические, химические и нотные знаки.

Хранение, кодирование и преобразование данных.



Хранение информации в памяти ЭВМ - одна из основных функций компьютера. Любая информация хранится с использованием особой символьной формы, которая использует бинарный (двоичный) набор изображающих знаков: (0 и 1). Выбор такой формы определяется реализацией аппаратуры ЭВМ (электронными схемами), составляющими схемотехнику компьютера, в основе которой лежит использование двоичного элемента хранения данных. Такой элемент (триггер) име­ет два устойчивых состояния, условно обозначаемых как 1 (единица) и 0 (ноль), и способен хранить минимальную порцию информации, называемую бит (этот термин произведен от английского "binary digit" - двоичная цифра). Понятие бита как минимальной единицы информации легко иллюстрируется простым примером. Допустим, Вы задаете собеседнику вопрос "Владеете ли Вы компьютерной грамотностью?", заранее точно зная, что он ответит "Да". Получаете ли Вы при этом, какую либо информацию? Нет, Вы остаетесь при своих знаниях, а Ваш вопрос в этой ситуации либо лишен всякого смысла, либо относится к ри­торическим.

Ситуация меняется, если Вы задаете тот же вопрос в ожидании получить один из двух возможных ответов: "Да" или "Нет". Задавая вопрос. Вы не владеете никакой информацией, т.е. находитесь в состоянии полной неопределенности. Получая ответ. Вы устраняете эту неопределенность и, следовательно, получаете информацию. Таким образом, двоичный набор возможных ответов, несущих ин­формацию, является минимальным. Следовательно, он определяет минимально возможную порцию получаемой информации.

Два бита несут информацию, достаточную для устранения неопределенности, заключающейся в двух вопросах при двоичной системе ответов и т.д. Преобразование информации из любой привычной нам формы (естественной формы) в форму хранения данных в компьютере (кодовую форму) связано с процессом кодирования. В общем случае этот процесс перехода от естественной формы к кодовой основан на изменении набора изображающих знаков (алфавита). Например, любой изображающий знак естественной формы (символ) хранится в памяти ЭВМ в виде кодовой комбинации из 8-ми бит, совокупность которых образует байт - основной элемент хранения данных в компьютере. Обратный процесс перехода от кодовой формы к естественной называется декоди­рованием. Набор правил кодирования и декодирования определяет кодовую форму представления данных или просто код. (Разумеется, процессы кодирования и декодирования в компьютере осуществляются автоматически без участия конечного пользователя).

Одни и те же данные могут быть представлены в компьютере в различных кодах и соответственно по-разному интерпретированы исполнительной системой компьютера.

Например, символ "1" (единица) может быть представлен в знаковой (символьной) кодовой форме, может быть представлен как целое число со знаком (+1) в коде целых чисел, как положительное целое без знака в коде кардинальных чисел, как вещественное число (1.) в коде вещественных чисел, как элемент логической информации (логическая единица - "истина") в коде представления логических данных. При этом любое из таких кодовых представлений связано не только с собственным видом интерпретации, но и с различными кодовыми комбинациями, кодирующими единицу.

Кодирование и хранение данных в компьютере должно обеспечивать не только надежное декодирование, но и защиту информации от разного рода сбоев, помех, вирусов, несанкционированного доступа и т.п.

Помехоустойчивое кодирование связано обычно с введением в кодовые комбинации двоичных символов избыточной информации, необходимой для обнаружения сбоев.

Компьютерные вирусы - помехи искусственной природы, создаваемые изощренными "шутниками-программистами. Эти вирусы попадают в персональные компьютеры обычно через внешние носители (дискеты), могут проявляться в совершенно непредсказуемых ситуациях и способны принести массу неприятностей вплоть до полной потери всей информации, сохраняемой в компьютере. Лучший способ борьбы с такими вирусами на персональной ЭВМ - не использовать сомнительные дискеты. Если компьютер уже "заражен", следует обратиться к "доктору" - специальной программе обнаружения и устранения виру­сов (не каждый из вирусов устраним!). Особую опасность вирусы представляют в компьютерных сетях, - здесь борьба с ними перерастает в отдельную проблему. Методы предотвращения несанкционированного доступа к компьютерной информации имеют прямое отношение к криптографии - науке об организации шифров.

Методы преобразования информации из одной формы в другую делятся на две большие категории: обратимые и необратимые. Обратимые преобразования позволяют преобразовать данные из одной формы в другую, сохраняя возможность совершить обратное преобразование с гарантией получения полного совпадения с исходными данными. Если такой гарантии нет и существует вероятность несовпадения исходных данных с полученными после обратного преобразования, имеет место влияние мешающих факторов - помех или ошибок. Преобразования с помехами всегда связаны с информационными потерями.

Например, автору известен случай, когда фамилия известного советского математика А.Я.Хинчина была переведена на английский язык как Khinchine, a обратный перевод на русский привел к "появлению" нового ученого с мировым именем по фамилии Кин-Чайн. По-видимому, китайца. Необратимые преобразования характеризуются невозможностью обратного преобразования и восстановления исходных данных. Примером необратимых преобразований может служить статистический анализ и, в частности, построение гистограмм.

Допустим, что исходные данные образуют журнал записи актов гражданского состояния (ЗАГС), - каждая такая запись содержит данные о персональных датах рождения и смерти граждан за определенный период времени (например, за год).

Статистический анализ такого журнала с целью определения соотношения между рождаемостью и смертностью связан с построением гистограммы, в которой фигу­рируют только два параметра: общее число рождений за выбранный период времени (рождаемость) и общее количество смертей за тот же период (смертность). Этот анализ приводит к построению гистограммы, которая может иметь следующий вид:



Разумеется, восстановить по такой гистограмме информацию журнала ЗАГС невозможно.

Необратимые преобразования данных обычно проводятся путем их обобщения и интегрирования с целью выявить, подчеркнуть и рельефно обозначить некоторые общие неявно выраженные или скрытые закономерности. В частности на основе гистограмм, аналогичных приведенной выше, можно сделать общие демографические выводы.


Задача резервирования



При эксплуатации компьютера по самым разным причинам возможна порча или потеря информации на магнитных носителях (винчестере или дискетах). Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерными вирусами и т.д. Для того чтобы уменьшить или вообще предотвратить потери в таких ситуациях, следует иметь копии используемых файлов и периодически обновлять копии изменяемых рабочих файлов.

Рассмотрим способы резервирования и сохранения информации для разработчиков, занимающихся САПР, обработкой цифрового звука, изображений, то есть связанных с большим объемом используемой и обрабатываемой информации.

Использовать дискеты для целей сохранения информации (как это делается обычно) очень не рационально и, более того, очень не удобно, в связи с ее большим объемом. Поэтому целесообразно применять накопители, обеспечивающие сравнительно небольшое время доступа и обладающие большой емкостью. Используем для этих целей лазерные диски и, появившиеся недавно (для рядового пользователя) накопители на магнитооптических и магнитных дисках.


Лазерные диски


Первые лазерные (оптические) диски появились в 1972 году и продемонстрировали большие возможности по хранению информации. Объемы хранимой на них информации позволяют использовать их для хранения огромных массивов данных (таких как базы данных, энциклопедии, коллекции видео и аудио данных). Один оптический диск, диаметром 12 см обладает емкостью до 680 Мбайтов! Такой объем хранимых данных, со временем доступа к диску около 200мс, скоростью чтения около 1200 килобайтов в секунду (для 8-ми скоростных накопителей) и, что не мало важно, низкая себестоимость таких дисков (порядка нескольких долларов) сделали их быстро очень распространенными хранителями информации. Легкая замена этих дисков позволяет носить с собой все материалы, требуемые для работы, в любом объеме. Оптические диски имеют очень высокую надежность и долговечность, что позволяет использовать их для архивного хранения информации. Но трудоемкая процедура записи и невозможность перезаписи ограничивает применение оптических дисков, как устройства для резервного хранения информации. Но, тем не менее, если разработчик использует большой объем постоянных (не изменяемых) данных, например, базы данных, различные библиотеки, то он может их записать на диск и использовать его, а не занимать место на винчестере под данную информацию. Таким образом, оптические диски используют как хранилище больших объемов информации.

Для подключения накопителя обычно применяется интерфейс ГОЕ, который так же используется для подключения к компьютеру винчестеров. В комплект входит инсталляционная программа. Она изменяет конфигурационные файлы системы так, чтобы из файла CONFIG.SYS загружался драйвер, который служит "переводчиком" при взаимодействии дисковода и ПК, а из файла AUTOEXEC.BAT запускалась программа MSCDEX.EXE, завершающая процесс инсталляции накопителя. Это позволяет сконфигурировать систему таким образом, чтобы накопитель система "видела" как еще один логический диск. Таким образом, подключение, настройка и использование накопителя на лазерных дисках не представляет большой сложности.

Последнее время появилось множество вариантов перезаписываемых оптических дисков. Фирмы производители предлагают различные технические решения данной проблемы. Например, предлагались устройства, способные записывать информацию на оптический диск прямо на рабочем месте пользователя, но перезапись такой информации оставалась под вопросом.

Магнитооптические диски



Наиболее жизнеспособными оптическими дисками, обладающие свойствами перезаписи, на сегодняшний день являются магнитооптические (МО) диски. Впервые МО диски появились в 1988 году и соединили в себе компактность гибких дисков и накопителя Bernoulli Box, скорость среднего жесткого диска, надежность стандартного Компакт Диска и емкость сравнимую с DAT лентами. Но широкому распространению МО дисков мешает сравнительно дорогая стоимость и конкуренция современных жестких дисков. По сравнению с современными жесткими дисками, они более медленны и уступают им по максимальным объемам хранимой информации. Это делает невозможным применение МО дисков вместо традиционных винчестеров. При этом МО диски имеют большие перспективы как вторичные накопители, применяемые для резервного хранения информации.

МО накопитель построен на совмещении магнитного и оптического принципа хранения информации. Записывание информации производится при помощи луча лазера и магнитного поля, а считывание при помощи одного только лазера. В процессе записи на МО диск лазерный луч нагревает определенные точки на диске, и под воздействием температуры сопротивляемость изменению полярности, для нагретой точки, резко падает, что позволяет магнитному полю изменить полярность точки. После окончания нагрева сопротивляемость снова увеличивается, но полярность нагретой точки остается в соответствии с магнитным полем примененным к ней в момент нагрева. В имеющихся на сегодняшний день МО накопителях для записи информации применяются два цикла: цикл стирания и цикл записи. В процессе стирания магнитное поле имеет одинаковую полярность, соответствующую двоичным нулям. Лазерный луч нагревает последовательно весь стираемый участок и таким образом записывает на диск последовательность нулей. В цикле записи полярность магнитного поля меняется на противоположную, что соответствует двоичной единице. В этом цикле лазерный луч включается только на тех участках, которые должны содержать двоичные единицы, и оставляя участки с двоичными нулями без изменений. В процессе чтения с МО диска используется эффект Керра, заключающийся в изменении плоскости поляризации отраженного лазерного луча, в зависимости от направления магнитного поля отражающего элемента. Отражающим элементом в данном случае является намагниченная при записи точка на поверхности диска, соответствующая одному биту хранимой информации. При считывании используется лазерный луч небольшой интенсивности, не приводящий к нагреву считываемого участка, таким образом, при считывании хранимая информация не разрушается. Такой способ в отличие от обычного, применяемого в оптических дисках, не деформирует поверхность диска и позволяет повторную запись без дополнительного оборудования. Этот способ также имеет преимущество перед традиционной магнитной записью в плане надежности. Так как перемагничивание участков диска возможно только под действием высокой температуры, то вероятность случайного перемагничивания очень низкая, в отличие от традиционной магнитной записи, к потери, которой могут привести случайные магнитные поля.

Механизмы МО накопителей строятся на базе механизмов обычных дисководов с небольшими конструктивными усовершенствованиями. В качестве интерфейса МО накопители оснащаются SCSI адаптерами (16 или 8 битными). Вместе с накопителем поставляются драйвера диска и утилиты форматирования низкого уровня. Многие поставщики также оснащают свои изделия специальными программами для резервного копирования. В настоящее время существуют несколько форматов для форматирования МО дисков CCS (непрерывное комбинированное слежение) и SS (шаблонное слежение). Первый из форматов разрешен стандартом ANSI, а второй также и ISO. В настоящее время формат CCS более популярен и имеет большее распространение. Стандартами определено два размера сектора 512 и 1024 байт. Некоторые производители смогли сделать чтение секторов любого размера, но их меньшинство. Большинство производителей поддерживают размер сектора равный 512 байтам.

Область применения МО дисков определяется его высокими характеристиками по надежности, объему и сменяемости. МО диск можно использовать для задач, требующих большого дискового объема, это такие задачи, как САПР, обработка изображений, звука. Однако небольшая скорость доступа к данным, не дает возможности применять МО диски для задач критичных ко времени. Поэтому МО диски обычно применяются для хранения на них временной или резервной информации. Для МО дисков очень выгодным использованием является резервное копирование жестких дисков или баз данных. В отличие от традиционно применяемых для этих целей стримеров, при хранении резервной информации на МО дисках, существенно увеличивается скорость восстановления данных после сбоя. Это объясняется тем, что МО диски являются устройствами с произвольным доступом, что позволяет быстро восстанавливать данные, в которых обнаружился сбой. Кроме этого при таком способе восстановления нет необходимости полностью останавливать систему до полного восстановления данных. Эти достоинства в сочетании с высокой надежностью хранения информации делают применение МО дисков при резервном копировании выгодным, хотя и более дорогим по сравнению со стримерами. Применение МО дисков, также целесообразно при работе с приватной информацией больших объемов. Легкая сменяемость дисков позволяет использовать их только во время работы, не заботясь об охране компьютера в нерабочее время, данные могут храниться в отдельном, охраняемом месте. Это же свойство делает МО диски незаменимыми в ситуации, когда необходимо перевозить большие объемы с места на место, например, с работы домой и обратно.

В таблице приведена сравнительная характеристика применимости МО дисков для различных классов.

Название

Дата выпуска

Первичная память

Вторичная память

Резервное хранение

Магнитооптические и фазоперем. диски

1988

Слабо

Отлично

Отлично

Магнитная лента на 4 мм кас.

1988

Неприемлемо

Неприемлемо

Отлично

Магнитная лента на 4 мм кас. со спирал. считыванием

1987

Неприемлемо

Неприемлемо

Отлично

Диски с однократной записью

1985

Слабо

Хорошо

Слабо

Магнитная лента на мини-кас. 6.35мм DC-2000

1984

Неприемлемо

Неприемлемо

Отлично

Сменные кас. диски Bernoulli

1983

Хорошо

Хорошо

Хорошо

Жесткие диски

1974

Отлично

Неприемлемо

Хорошо

Магнитная лента на мини-кас. 6.35мм DC-6000

1972

Неприемлемо

Неприемлемо

Отлично

Гибкие диски

1971

Слабо

Неприемлемо

Слабо



Сменные магнитные диски



В марте 1995г фирма lomega выпустила накопитель Zip ценой $200, на сменных дисках которого помещается до 100 Мбайт информации и стоят они около $20. Накопитель Zip стал самым недорогим средством для перемещения данных и увеличения объема хранящейся информации. Иногда его даже называют накопителем на гибких дисках следующего поколения. Накопитель Zip работает на 3,5-дюймовых сменных магнитных картриджах и сочетает быстродействие винчестера с удобством дискеты (объем диска - 100 Мбайт, скорость вращения -около 3000 об./мин, время доступа - не более 30 мс). Дисковод может быть подключен к компьютеру через интерфейс SCSI или параллельный порт, причем в последнем случае остается дополнительный "транзитный" выход для принтера. С накопителем поставляется собственное программное обеспечение Zip Tools для резервного копирования данных и каталогизации дисков. Устройство одинаково хорошо работает в разных ОС, будь то DOS, Windows или OS/2. Масса накопителя 450г.

Накопители Jaz - это новое воплощение идеи сменного магнитного диска и эффективный способ неограниченного наращивания дискового пространства ПК. Подключив накопитель Jaz к SCSI-адаптеру, можно получить еще один сменный "жесткий диск" объемом 1 Гбайт. Накопитель Jaz использует магнитные носители и работает по тому же принципу, что и жесткий диск. Время доступа к данным (17 мс) и время поиска (12 мс) устройства Jaz соизмеримы с аналогичными характеристиками современных винчестеров. На копирование 1 Гбайта информации требуется около пяти минут, поэтому дисковод очень удобен для архивирования данных. Один картридж Jaz позволяет сохранять и воспроизводить, например, двухчасовой видеофильм (в формате MPEG-1), восьмичасовую звукозапись высокого качества или 150 цветных фотографий в формате PhotoCD. Подобно накопителю Zip, устройство Jaz поставляется с собственным программным обеспечением Jaz Tools, которое совместимо с Windows, Windows 95, OS/2 и позволяет оптимально использовать дисковое пространство, создавать и каталогизировать многогигобайтовые архивы на нескольких дисках.

Использование программ архивации



Рассмотренные выше средства создания резервных копий данных предполагают прямое копирование информации на носители. При этом архивные копии занимают столько же места, сколько занимают исходные файлы. Это приемлемо, если носитель обладает большим объемом и не требуется экономить место. Но если таких накопителей нет и желательно сэкономить место, занимаемое архивом, то можно воспользоваться стандартным способом - держать архивы на гибких магнитных дисках (дискетах). В этом случае удобно воспользоваться для создания архивных копий специальными программами для архивации файлов. Эти программы позволяет не только сэкономить место на архивных дискетах, но и объединять группы совместно используемых файлов в один архивный файл, что позволяет гораздо легче разбираться в архиве файлов.

Архивный файл представляет собой набор из одного или нескольких файлов, помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве, а также код циклического для каждого файла, позволяющего проверить целостность архива.

Существует много программ-архиваторов, имеющих различные показатели по степени и времени сжатия, эти показатели могут быть разными для различных файлов (текстовых, графических, исполняемых и т.д.), то есть один архиватор хорошо сжимает текстовый файл, а другой - исполняемый. Среди самых известных и часто используемых программ выделяются следующие: ARJ, PKZIP, RAR, LHA, НА и др.

Динамическое сжатие данных



Существует программы, в которых сжатие данных реализовано на уровне драйверов. Вместо того чтобы сжимать файлы по отдельности или группами, программа сжимает целиком весь диск. Программа "на лету" упаковывает данные, записываемые на диск, и автоматически распаковывает считываемые с диска. В результате работа программы для пользователя незаметна: после установки программы не приходится выбирать какие именно файлы нужно сжимать. При этом наблюдается небольшое замедление работы при чтении и записи данных на сжатый диск, но оно не сильно ощущается.

Существуют две известные программы, выполняющие данный способ упаковки, это DoubleSpace и Stacker. DoubleSpace входит в поставку MS DOS, начиная с шестой версии, a Stacker поставляется отдельно.

Данные диски лучше создавать на носителях сравнительно большого объема, например, на магнитооптических дисках или на дисках типа Zip, Jaz. На дискетах лучше все же пользоваться обыкновенными архиваторами.

Выводы



Рассмотренные способы и средства резервирования и сохранения данных позволяют быстро создавать архивные копии рабочих файлов и надежно защищать информацию от уничтожения или порчи в различных непредвиденных ситуациях.