Хранение и кодирование информации

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

ия являются для него новыми и понятными Информация - знание человека, сообщение которого должно быть информативным. Если сообщение не информативно, то количество информации с точки зрения человека = 0.

Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=28, то 1символ несет в тексте 8 бит (наименьшее деление) информации.

Итак, в чём же измеряется информация? В основном в информатике берут за основу единицы измерения, производные от бита, самой маленькой единицы информации. Целые количества бит отвечают количеству состояний, равному степеням двойки. Особое название имеет 4 бита - ниббл (полубайт, тетрада, четыре двоичных разряда), которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт. Следующей по порядку популярной единицей информации является 8 бит, или байт. Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Килобайт. Для измерения больших количеств байтов служат единицы килобайт (Кбайт) = 1000 байт - с точки зрения математики. Но в информатике 1 Кбайт = 1024 байт. Такая путаница происходит из за различий в десятичной и двоичной системах исчисления. Поэтому МЭК (Международная Электротехническая Комиссия) придумала для Кбайт, Мбайт, Гбайт и т. д. в качестве терминов кикибайт, мебибайт, гибибайт. Однако, эту терминологию очень много критикуют и, поэтому, её редко можно слышать в устной речи. Но вернёмся к килобайтам. Такой порядок величин имеют, например:

Сектор диска обычно равен 512 байтам то есть половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.

Классический размер блока в файловых системах UNIX равен одному Кбайт (1024 байт).

Страница памяти в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты 3,5? высокой плотности равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт. Единицы мегабайт (Мбайт) = 1000 килобайт = 1000000 байт и мебибайт = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт. Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД (Накопители на жестких магнитных дисках) десятичные мегабайты были более популярны. Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт. Единицы гигабайт (Гбайт) = 1000 мегабайт = 1000000000 байт и гибибайт = 1024 Мбайт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ? 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флэш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы терабайт или тебибайт (1012 Гбайт), петабайт или пебибайт (1015 Тбайт) и т. д.

 

2. Принцип хранения данных

 

Возрастающая ценность информации и консолидация вычислительных мощностей определяет новый подход к технологиям организации хранения и доступа к данным. Предприятиям необходимо решать задачи управления увеличивающимися массивами данных, организовать надежный доступ к информационным массивам, обеспечить защиту информации от утраты и повреждений.

Система хранения разрабатывается как обязательная подсистема в центрах обработки данных и является важнейшим компонентом для обеспечения надежного и стабильного функционирования всех информационных сервисов.

Система хранения данных (СХД) - предназначена для централизованного надежного хранения, управления и предоставления данных. СХД является ключевым элементом консолидации ЦОД (центр обработки данных), с которой тесно взаимодействуют вычислительные мощности, занятые обработкой информации. Структура СХД является технологическим фундаментом, вокруг которой строятся вычислительные системы. Технологии управления данными - решения для максимально эффективного использования ресурсов хранения и обеспечения непрерывности бизнеса.

Классическая система хранения данных включает в себя следующие компоненты:

Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные дисковые массивы, как правило, используют технологию Fibre Channel для подключения к ним серверов и внутри массива для доступа к дискам. Они могут масштабироваться до сотен терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций;

Инфраструктуру доступа серверов к устройствам хранения данных. В современных СХД для объединения компонент, как правило, используется Сеть Хр