Лекция №3

Вид материалаЛекция
Подобный материал:
Лекция № 3

10.03.2009

Денисов


Сегодня мы поговорим о функциональной области сетевого управления, и если успеем, то поговорим про основные принципы сетевого мониторинга

Итак, функциональные области сетевого управления.

Вопрос, что такое функциональная область? Это набор объектов, правил, методик, описывающих заданные, потребные, ожидаемые условия при решении определенной задачи. Т.е. здесь два ключевых момента: ограниченность и конкретность задачи.

Вот из этого и будем исзодить

Выпишем пять функциональных областей сетевого управления
  1. управление сбоями (fault management)
  2. управление производительностью (?)
  3. управление учетом потребления услуг (accounting management)
  4. управление конфигурацией наименования (configuration and naming management)
  5. управление безопасностью (security managemtnt)

Поговорим про каждую из них более подробно. Про каждую из этих областей будет лекция или большой кусок лекции. Пожтому сейчас кратко, важно понять те задачи, которые сосредоточены внутри каждой ищ областей.


Управление сбоями

Сбой – формальный термин, это не ошибка, не погрешность, не неисправность, а именно сбой, отказ. Как правило, аппаратная неисправность.

Сбой – стойкая неспособность информационной системы выполнять свои целевые функции, требующая для своего решения внешнего вмешательства.

Это очень важное, ключевое определение
  1. стойкость. Любая система призвана решать бизнес-задачи, например, обслуживать клиентов в банке. Поэтому под сбоем понимается нарушение выполнения системой своих целевых функций. В этом принципиальное отличие от просто отказа. Грубо говоря, если у вас в системе есть несколько серверов, один из них сняли для профилактики, но все работает, то это сбоем не является. То есть сбой это если где-то что-то идет не так. Например, большие задержки, ли отказы обслуживания. То есть нарушение целевых функций.
  2. Вторая особенность стойкости – бывает одиночная ошибка, но это не сбой. Но чрезмерное кол-во одиночных ошибок это Мб сбоем
  3. внешнее вмешательство. Известно, что при передаче данных всегда возникают ошибки. Это нормальная ситуация, несмотря на то, что произошла ошибка, внешнего вмешательства не потребуется. Во все алгоритмы, во все протоколы заложена работа с такой ошибкой. Поэтому никаких дополнительных действий не требуется. Но если сгорел винчестер в сервере, то автоматически решить эту проблему не удастся. Или физический провод съели крысы. Заметим, что под внешним вмешательством подразумевается не только физическое вмешательство человека, а и нестандартные действия системы сетевого управления (например, пропал Интернет, и система перебросила нас на резервную линию)


Задачи, стоящие в области управления сбоями. Из 4 штуки
  1. обнаружение сбоев. То есть понять что, что-то не так. Выяснить что вообще есть сбой. Возникла ситуация которая
    1. явно не пройдет сама
    2. мешает исполнению системы
    3. требует внешнего вмешательства
  2. локализация сбоев. Установление точного места и причины сбоя. любой сбой может вызываться массой причин
  3. минимизация влияния сбоя на работу сети. Сбой может затрагивать не только оборудование вызвавшее его, но и другое оборудование. Например, сбойная сетевая карта, или коммутатор который рассылает барахло в среду передачи данных. Действия мб разными (отключить сбойный порт, задействовать резервный канал Интернета)
  4. восстановление работоспособности в полном объеме. Ремонт. Мб автоматизированный, а Мб не автоматизированный.


Управление производительностью.

Управление сбоями отвечает на вопрос двоично – работает или не работает.

А управление производительностью – насколько хорошо её функционирование удовлетворяет заданным характеристикам. Количественная оценка качества работы сети.

Это важно для управления сбоями (в частности)

Задача
  1. дать количественную оценку соответствия заданным целевым значениям.
  2. Оценка эффективности использования ресурсов
  3. Помощь планирования развития сети


Управление учетом потребления услуг

В сети происходит единомоментно масса различных событий. Часть задач в этой области дает управление производительностью (сколько места на диске, сколько байт передано по каналу) а учет потребительских услуг – не только что потребил, а _кто_ потребил (пользователь, устройство, программа).

Файл сервер предоставляет услуги хранения файлов пользователям, серверам и т д.

Взгляд на систему как на связанные сервисы. Сам учет потребления услуг ведется самим сервисом. Однако, сведение всех этих данных в единый формат, сбор данных, корреляция этих данных – это задача этой области.


Управление конфигурацией и наименованием.

Коль скоро у нас есть оборудование, мы хотим как-то влиять на его работу.

Управление коф – управление настройкой, свойствами устройств. Каждое устройство представляется как набор атрибутов, которые однозначно описывают данное устройство.

Причем здесь именование. В сети есть много имен и разных связей между ними (доменные имена, ип адреса, мак, имя базы данных) Управление взаимосвязями между именами это отдельная большая область.


Управление безопасностью.

Управление службами, сервисами безопасности (ибо сама система сетевого управления не решает вопросы безопасности)

Задача: Обеспечить согласованное выполнение всех сервисов безопасности.

Например, антивир обнаружил вирус. Система сетевого управление может отдать команду отключить весь входящий-исходящий трафик с этой машины.


Один важный вид классификации для этих функ областей.

Нам удобно все процессы разделить на два класса
  1. сетевой мониторинг (network monitoring) (пассивный сбор данных)
  2. сетевое управление (network control) (прямое вмешательство в функционирование сети)

так получилось, что в разных сетевых областях набор задач разный, в одних преобладает мониторинг, в других управление. Неудивительно, что в областях управления сбоями, производительностью и учета потребления услуг большинство задач относится именно сетевого мониторинга. А в областях сетевой конфигурации и именованием и безопасностью относится к прямому вмешательству.


Принципы сбора данных сетевого мониторинга.

В любой системе сетевого управления источником управления всегда являются сетевые элементы. Приемником и центром обработки является всегда станция сетевого управления. Однако сами сценарии сбора бывают разными.

Первый вопрос: какие вообще данные бывают, откуда они появляются и кем и в какие моменты они востребованы.

Все данные которые у нас есть, можно разделить на три группы
  1. статическая
  2. динамическая
  3. статистическая

На остновании статической информации строится динамическая, на остновании динамической и статической – статистическая.

Статическая – инфа, которая меняется достаточно редко. Вся эта инфа делится на два класса – информация о сенсорах и инфа о конфигурации. Инфа о сенсорах: в нашей сети есть масса источников данных. Каждый сет элемент может предоставлять инфу о себе, инфу о других сетевых элементах. Все что связано со сбором данных (какая инфа, в каком формате, как часто, какова точность) относится к разделу сенсоров. Конфигурация – собственно информация о статических характеристиках сетевых устройств (например тип процессора, платы расширения, версия прогр обеспечения)

На основе статической информации собирается динамическая информация. Меняется, обновляется достаточно часто. Вся динамическая нформация делится на два блока информация о статусе и информации о событии. Инфа о статусе- то что имеет свойство меняться во времени (например загрузка ЦП в данный момент времени, свобоное место на диске, кол-во транзакция в минуту). Собирается с помощью сенсоров. Информация о событии (разовом действии) Например, вышел из строя жесткой диск, перезагрузка, вкл/выкл сетевой порт, обновилась версия ПО, логин пользователя, телефонный звонок. Это разовое однократное изменение состояния устройства.

На остновании статической и динамическйо строится статистическая информация.

Это накопление информации, агрегация. Например число заходов в сутки на сайт.

Откуда и какая информация берется – либо сетевой элемент, либо станция сетевого управления. Информация о сенсорах и конфигурации (статическая) как правило, поставляется самим устройством. Динамическая информация, в большинстве случаев, поставляется самим сетевым элементом. Однако динамическая информация может собираться не с самого сетевого элемента, а с соседних сетевых элементов, или связанных с данным сетевым устройством.

Статистическая информация примерно поровну производится между станцией сетевого управления и сетевым элементом (ибо собирать совсем всю информацию о сетевом элементе невыгодно, поэтому первичная агрегация, анализ выполняется на элементе).