Telecommunication technologies телекоммуникационные технологии ( 1, 19 марта 2008 года)

Вид материалаДокументы

Содержание


1 Введение. Общие принципы построения каналов передачи данных и сетей
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   12

1 Введение. Общие принципы построения каналов передачи данных и сетей

Семенов Ю.А. (ГНЦ ИТЭФ)


Создатель снабдил людей неплохими системами коммуникаций. Это, прежде всего органы зрения, слуха и голосовой аппарат. Наиболее важные из них задублированы - мы имеем два уха и два глаза, что создает предпосылки стерео восприятия и пространственной локации источника звука или оптического объекта. Определенную информацию об окружающей среде мы получаем от органов вкуса, обоняния и осязания. Эти информационные каналы весьма важны для сохранения жизни, но с точки зрения потоков данных они достаточно узкополосны. Самым широкополосным нашим каналом является визуальный. В оптической области люди могут воспринимать волны с длиной волны от 4000 до 7000нм, что в принципе может обеспечить потоки данных масштаба ~60Тбит/c. Проблема в том, что человек способен воспринимать <<10Мбит/с, обрабатывая эти данные лишь частично (речь идет о восприятии движущегося изображения). В акустическом диапазоне наши уши чувствительны для частот от 20 Гц до 20 кГц. Наш акустический канал принципиально асимметричен. Передачу данных мы осуществляем голосом (полоса 600 Гц - 6кГц), а восприятие слухом, который имеет более чем в два раза большую полосу пропускания. Уместен вопрос, зачем Природа или Создатель сформировали столь асимметричный канал? Отказать в рациональности такого решения нельзя. Ведь в реальной жизни хотя бы с точки зрения безопасности через уши мы получаем данные о шорохе листвы, по которой подползает к вам змея или о подлетающем комаре. Частотные диапазоны этих шумов находятся вне области воспроизведения нашим голосом. Это же касается раскатов грома или звука выстрела. Отсюда следует, что мудр тот, кто больше слушает, чем говорит, так он способствует накоплению информации в своей памяти.

Огромен динамический диапазон воспринимаемых нами звуков > 1:20000. К счастью имеющийся у нас аппарат преобразования звука в нервный (электрический) сигнал является нелинейным. В противном случае при близком грозовом разряде или выстреле мы могли бы погибнуть от шока - из-за слишком большого импульса возбуждения. Устройство преобразования звука у человека имеет логарифмическую характеристику, что спасает нашу нервную систему от перегрузок. Это позволяет нам воспринимать и шорох листвы и выживать, когда сосед слушает тяжелый рок при 300Вт звуковой мощности или пытается завести свой мотоцикл на балконе. Частотный диапазон восприятия у нас настроен так, чтобы воспринимать жизненно важные звуковые сигналы. Наш голосовой аппарат способен воспроизводить самые разнообразные звуки, это позволило человечеству сформировать языковую систему коммуникации. Человеческий голос состоит из гласных и согласных звуков. Гласные звуки генерируются, когда голосовой тракт открыт и определяются резонансом, основная частота которого зависит от размера и формы голосовой системы, от положения языка и челюстей говорящего. Эти звуки для интервалов порядка 30 мсек являются почти периодическими. Согласные звуки формируются, когда голосовой тракт частично перекрыт, эти звуки являются менее регулярными по сравнению с гласными. Некоторые современные системы генерации и передачи голоса используют модели голосовой системы с ограниченным числом параметров (например, размер и форма различных полостей), а не простое стробирование формы голосового сигнала. Вполне возможно, что успешное использование звуков для сигнальных целей в свою очередь стимулировало развитие гибкости голосового аппарата.


Акустическое общение (да и вообще любая передача сигналов) предполагает соглашение между источником и приемником относительно значения сигналов или их комбинаций. Многообразие таких сигналов (акустический язык) определяется уровнем развития отношений в данном конкретном сообществе.


Следующим шагом на пути цивилизации было создание письменности. Сегодня трудно точно сказать, когда это произошло. Ясно, что попытки такого рода производились многие тысячи лет до рождества Христова. Все началось с наскальных рисунков. Позднее они стали формализоваться, привязываться к фонетике голосовой речи, письменность ведь вначале рождалась, как средство удаленной коммуникации, расширяющее возможности устной речи. Был бы уже тогда телефон, и появление письменности вполне могло задержаться на многие века.

Наконец был создан символьный язык для описания не только объектов реального мира, но и абстрактных понятий. Достаточно вспомнить скрижали, которые Бог передал Моисею. Об этом говорится в Ветхом завете, и было это задолго до рождества Христова. Но сами эти камни с письменами предполагали, что народ или хотя бы священнослужители были способны прочесть то, что на них написано. Письменность предполагает соглашение между пишущим и будущими читателями относительно значения графических символов.


Письменность открыла возможность передавать информацию от умерших к живым, позволила накапливать технологические знания, сделала возможным развитие науки.


В начале письменность была уделом избранных и являлась криптографической системой. Читать и писать могли только священно служители. Чтобы убедиться в этом, достаточно заглянуть в Ветхий завет.

Изустные знания ненадежны, легко искажаются. Впрочем, это было свойственно и первым письменным источникам, ведь первые книги просто переписывались вручную. В качестве носителя использовались специально обработанные шкуры животных - пергамент, или прототип бумаги - папирусы (древнейшие египетские папирусы относятся к 25-му веку до нашей эры) и, наконец, во втором веке нашей эры бумага (Китай). В начале 11-го века в Китае начали печатать книги с использованием подвижных литер, выполненных из глины или дерева. В 14-ом веке в Корее стали применяться для печати подвижные металлические литеры (чем не прототип пишущей машинки?). Практически с самого начала в рукописях и “полиграфии” использовалось несколько цветов.

Сначала записанная информация имела вид свитков. Позднее они стали объединяться, такие блоки листов стали называться кодексами. Известные древнейшие библиотеки относятся ко 2-3 тысячелетиям до нашей эры, создавались они героическими усилиями переписчиков. Переписчик часто заботливо “исправлял” непонятные ему места, внося неизбежные субъективные искажения. Иногда такие искажения вводились сознательно в угоду политическим, идеологическим или религиозным воззрениям.

Книгопечатание в Европе появилось сравнительно недавно - в середине 15-го века в Германии благодаря усилиям Гуттенберга (литеры из глины). Каменные скрижали долговечны (не беспредельно), но неудобны для переноса и изготовления. Люди, правда, научились писать на глиняных пластинках, которые потом обжигались на солнце, но и это не решало проблемы. Надписям на камне мы обязаны своим знаниям о самых древних периодах человеческой цивилизации. Бумага и пергаменты хорошо горят (и гниют), именно это послужило причиной потери многих ценных манускриптов. Пожары же преследовали человечество с самого начала, с момента освоения технологии обогрева и приготовления пищи на очаге. До нашего времени дожили лишь небольшие фрагменты некоторых древних библиотек (вспомним хотя бы судьбы Александрийской библиотеки или библиотеки Ивана Грозного). Бумажные книги существуют уже более 800 лет. И только в конце 20-го века благодаря развитию вычислительной техники у них появился конкурент - CD- и DVD-диски (с объемом данных 600-750 и более Мбайт и это не предел). На данной странице около 3,5 килобайт информации. Один такой диск может содержать тексты нескольких книг. Объемная плотность информации в CD превосходит книжную в десятки раз. В принципе технология CD при определенных условиях может обеспечить длительность хранения на уровне многих сотен, а может быть и тысяч лет.

Наш голосовой канал, прежде всего, предназначен для общения с себе подобными. Часть предыдущей фразы до запятой содержит 19 букв (в кодовом представлении 19 байт). В норме она произносится примерно за одну секунду, что создает поток данных в 152 бит/сек. Хорошо тренированный оператор за полторы-две секунды может напечатать эту часть фразы.


Отсюда видно, что наши собственные возможности передачи данных, сопряженные с движениями пальцев рук или языка весьма ограничены и не превышают (100-150) бит/сек.


Можно предположить, что это связано с особенностями структуры нашей нервной и мышечной системы (задержками в цепи обратных связей). Следует иметь в виду, что эта активность сопряжена с необходимостью распознавания образов - важным свойством всего живого.

Нашу нервную систему вполне можно рассматривать, как локальную сеть, внешние же коммуникации человека могут служить аналогом Интернет. По внутренним нервным магистралям распространяются сигналы от различных рецепторов, сообщая данные о состоянии окружающей среды и самого организма, аналогично, но в противоположном направлении передаются управляющие сигналы. Обратные связи являются основой жизни и способом адаптации к окружающей среде. Я не являюсь тонким знатоком физиологии человека, но, тем не менее, позволю предположить, что в нашей нервной системе используется, как “проводные” соединения, так и адресная система доставки сообщений. Мне трудно представить, например, чтобы тактильные и температурные датчики транспортировали в мозг сигналы по разным каналам, такое решение представляется неэффективным, хотя вполне может оказаться, что я ошибаюсь. Для построения систем, непосредственно контактирующих с органами чувств человека, крайне важно точно знать параметры внутренних каналов передачи сигналов. Такие данные помогут корректно спроектировать интерфейсы, оптимизировать и заметно удешевить технические решения.

Наш визуальный канал принято справедливо считать быстродействующим. Быстродействие, тем не менее, здесь не столь велико, как это можно предположить. Во-первых, быстродействие ограничивает инерциальность датчиков в глазу, которая характеризуется постоянной времени ~0,04 сек (вспомним частоту кадров в кино). Во-вторых, это скорость обработки и распознавания образов в головном мозге. Оценить эту составляющую быстродействия сложнее. Попытаемся все же это сделать. За сколько секунд вы можете прочесть эту страницу? Это у вас занимает 1-1,5 минуты? Тренированные люди способны читать до 1000 слов в минуту. Будем считать среднюю длину слова равной 8 букв, тогда получим скорость восприятия 135 байт/c.


Таким образом, максимальная скорость обработки текстовых данных составит <150байт/сек. Всего в 10 раз больше, чем на слух!


Мне могут возразить, что, смотря телевизор, мы обрабатываем большие потоки. Возможно это так. Но в любом случае это не больше 200кбайт/сек (вспомним предельную скорость передачи данных в каналах цифрового ТВ).


Бессмысленно для человека передавать потоки данных в форматах и при скоростях не согласованных с возможностями его восприятия.


Об этом должны задуматься режиссеры телефильмов, дизайнеры WEB-страниц, создатели рекламы и т.д. С другой стороны следует помнить, что, обладай человек более скоростным визуальным каналом (если бы наши глаза не имели инерциальности запоминания видео изображения), не было бы современного кино и телевидения, так как люди воспринимали бы это как мелькание картинок, а не как имитацию реальных образов. Кино и телевидение по своей природе не являются зеркальным отражением того, что оказывается в фокусе входного объектива киноаппарата или телевизионной камеры. Обе эти технологии успешно используют особенности нашего зрения и мозга. Эти соображения лишний раз показывают насколько важно учиться у природы.

Мы еще очень мало знаем об особенностях работы нашей аналитической системы. Очевидно, что значительная часть ее мощности используется для нормального функционирования нашего организма (переработка пищи, борьба за выживание во враждебной среде и т.д.). Полагаю, что те, кто писал программы для человекоподобных роботов, со мною согласятся. Просто удерживать тело в вертикальном состоянии задача не из простых. Вы знаете, что происходит с человеком, чей мозг частично отравлен алкоголем. Все мы знаем также, что происходит с нашим телом, которое существовало десятки лет, после смерти. Оно разлагаться присутствующими бактериями за несколько дней. Другой важной функцией нашего аналитического аппарата является обслуживание наших органов чувств (обработка поступающих данных и выработка ответных реакций). И лишь остаток ресурса остается для управления интеллектуальной сферой. Может быть, из-за большого запаса аналитического потенциала многие великие ученые прожили долгую жизнь (например, Леонардо да-Винчи, Л.Толстой).

При разговоре мы можем управлять интонацией, эмоциональной окраской, а при личном контакте и жестами. Иной раз мы одним междометием способны передать своему партнеру больше, чем иной политик в часовой речи. Но эта информационная составляющая доступна и высокоразвитым животным, например собаке. Важно заметить, что такие данные пока трудно факторизуемы и по этой причине пока не доступны для компьютерного анализа.

Если попытаться проанализировать полезность или эффективность получаемой информации (то, что изучает ветвь семиотики, называемая прагматикой), то результат будет во многих случаях вообще печальным. При разговоре мы часто повторяем одни и те же фразы, мысли и факты, произносим огромное число слов-паразитов. Я уже не говорю о пустой болтовне по телефону, уведомляющей собеседника о количестве выпитого накануне или о покрое юбки жены соседа. Люди по какой-то причине не могут без этого. Нам приходится слушать речи высоких политиков или читать статьи или книги, смысл которых ничтожен, а содержащаяся в них информация может быть охарактеризована несколькими битами, уведомляющими слушателя или читателя об честолюбивых амбициях автора. Многоточие в конце романа классика во много раз информативнее. Трудно представить, чтобы ЭВМ Центра управления полетом, прежде чем передать управляющую информацию бортовой машине, перешлет ей сначала анекдот, найденный только что в Интернет. Впрочем, это относится скорее к области информатики, чем телекоммуникаций. Хотя от умения компактно передавать наиболее существенные данные зависит эффективная работа информационных систем будущего.

Здесь мы прикасаемся к проблеме издержек, связанных с заголовками пакетов данных, пересылаемых по сетям. Так при удаленном доступе (протоколы Telnet, SSH и пр.) на один переданный байт, характеризующий нажатую клавишу терминала, приходится более 50 байт заголовков и другой вспомогательной информации.


Эффективность удаленного ввода с консоли, как видите, меньше кпд паровоза. Но современные телекоммуникационные технологии пока не могут предложить ничего лучшего.


Способность передачи определенных данных посредством мимики и поз роднит человека с представителями животного мира. Животные этим методом общения пользуются более активно, отчасти компенсируя таким способом отсутствие речевого канала. Недостаточное развитие звукового информационного общения у животных возможно связано с малым объемом данных, которые им нужно передавать в отсутствии непосредственного визуального контакта. Звуковая сигнальная система более развита у стадных животных (например, у дельфинов или волков), к которым с этой позиции можно отнести и человека.

К сожалению, Создатель не предусмотрел передающего канала, образующего пару для нашего зрения. То ли он столкнулся с какими-то технологическими трудностями, то ли в силу своей мудрости увидел в этом истоки серьезных бедствий в будущем. Оптическая пара приемо-передатчиков могла бы дать нам несравненно более мощный канал общения. Не ясно только, смог бы наш мозг сформировать и обработать такой поток данных. Мозг наш достаточно мощное аналитическое устройство, но и его возможности ограничены. Ведь скорость распространение возбуждения по нервным волокнам от мозга к периферийным мышцам исчисляется миллисекундами или даже десятками миллисекунд. Может быть, именно по этой причине наши глаза и уши размещены рядом с головным мозгом. Если бы глаза размещались, например, на запястьях (иногда неплохо было бы иметь там и уши), мы могли бы, разведя руки, с высокой точностью определять расстояние до любого объекта (разрешающая способность возросла бы более чем в 20 раз). Но время доступа к данным при этом неизбежно увеличилось бы, возросло бы и время отклика на сигналы опасности, что создало серьезные угрозы безопасности из-за замедления реакции. Следует иметь в виду, что скорость распространения синала по синапсам и аксонам нейронов составляет около 120 метров в сек. Кроме того, для кистей рук велика вероятность повреждений, ведь они у нас являются одним из главных исследовательских инструментов. Да и размеры человеческого тела с учетом того, что главным его инструментом выживания является мозг, полагаю, определяются, среди прочего, скоростью распространения сигналов возбуждения по нервным волокнам.

Кто знает, не является ли наблюдающаяся в последние годы акселерация (увеличение размеров человеческого тела от поколения к поколению) свидетельством вырождения человеческого рода.


Возможно, из-за больших задержек в цепях обратных связей вымерли все гигантские ящеры.


Мы хорошо и быстро решаем задачи распознавания видео и аудио образов, но затрудняемся при перемножении двух 10-значных чисел, в то время как современная ЭВМ с такой задачей справится за микросекунду или даже быстрее.

Вообще для живых существ характерна высокая эффективность процесса распознавания на самых разных уровнях (распознавание голоса, лиц собеседников или чужих молекул в крови), так как это крайне важно для выживания во враждебной среде.


Наши органы чувств и аналитический аппарат не совершенны. Осознание и количественное определение этого позволило существенно усовершенствовать создаваемые человеком средства коммуникаций. В процессе распознавания наш глаз останавливает свое внимание на определенных характерных точках изучаемого объекта.


Полагаю, что использование фиксации внимания на определенном, ограниченном числе узловых точек изображения позволит существенно сжать данные, так как другие менее существенные детали картинки могут быть переданы менее подробно (с меньшей разрешающей способностью).


Человечество постоянно стремилось расширить возможности своих органов чувств (каналы коммуникаций с окружающей средой). Так были созданы подзорная труба и микроскоп, термометр и газоанализаторы, высокочувствительные микрофоны и радиолокаторы, а также многое другое. Подзорная труба может рассматриваться как аналоговое однонаправленное телекоммуникационное устройство.

Рассмотрим, какие искусственные каналы коммуникаций создал сам человек за последние тысячелетия своего существования. Представьте себе следующую сцену, возможно имевшую место много столетий тому назад.

На горизонте поднялось легкое облачко, которое начало расти и шириться. Постепенно становилось ясно, что это облако пыли, поднятого множеством лошадиных копыт. На вершине холма дозорные настороженно следили за приближением этого отряда и, когда стало ясно, что это большой отряд противника, старший дал команду разжигать сигнальный костер. Из небольшого очага, где огонь поддерживался круглые сутки, специальным захватом, была извлечена пылающая головня и помещена в основание большого сигнального костра. Сначала огонь разгорался медленно, но уже через несколько минут столб дыма и огонь поднялись на многие метры. Тогда его заметил другой сигнальный отряд, размещенный в нескольких верстах от первого, и там также зажгли сигнальный костер.

Такая техника позволяла передать 1 бит информации (логический нуль или логическая единица) на расстояние до 100 км менее чем за один час (время сильно варьировалось в зависимости от рельефа местности и погоды). Скорость такого метода передачи данных в дневное время можно было удвоить, используя черный или белый дым. Костры часто размещались на специально построенных вышках для увеличения расстояния между ними. Здесь нечего говорить о надежности, проливной дождь (или вьюга) мог помешать разжечь костер, да и видимость при этом могла оказаться весьма ограниченной.

Альтернативный метод посылки депеши с всадником позволял передать несравненно больший объем информации, но почти на порядок с меньшей скоростью, ведь прямых дорог тогда не было, да и водные преграды или горы могли существенно замедлить движение. В море сходный метод, использовавший сигнальный масляный фонарь, служил для передачи коротких сообщений для координации действий кораблей в пределах прямой видимости.

Но даже такой технологии было достаточно для длительного существования гигантских государственных образований (от империи Александра Македонского до Римской империи). Именно со скоростью лошади или деревянного гребного или парусного бескилевого судна передавались сообщения с периферии в центр, а оттуда в обратном направлении посылались руководящие инструкции или решения. Задержка достигала многих месяцев. Удивительно, но этого было вполне достаточно для стабильного существования государства. Вероятно, чиновники были вынуждены обдуманно принимать решения, так как быстро исправить ошибку было нельзя. Решение проблемы здесь лежит в предоставлении определенной самостоятельности властям провинции (приближение центра принятия решения к объекту управления). Еще одним средством решения проблемы большой задержки в цепи принятия решения (RTT в сетевой терминологии) является выработка набора унифицированных правил реагирования на стандартные ситуации (в случае сетей такие правила называются протоколами). Даже применение самых мощных информационных и телекоммуникационных технологий не позволят эффективно управлять из Москвы автомобилем во Владивостоке.

Когда императоры Римской империи попытались в долговременном плане построить жесткую вертикаль власти, империя распалась сначала на две части, а позднее на большое число независимых государств.


Техника телекоммуникаций с временем RTT (Round Trip Time), равным 2-6 месяцам, просуществовала без существенных изменений более 1500 лет.


Только в 19-ом веке стали появляться железные дороги, пароходы и, что особенно важно, электрический телеграф и телефон. Связь с применением азбуки Морзе в 1840-ых годах позволяла передать до 10 бит/сек на расстояние десятки и сотни километров. Азбука Морзе, пожалуй, была первым широко распространенным телекоммуникационным кодом (см. таблицу 1.1). Коды здесь представляют собой последовательности точек и тире. Отличие точки от тире определяется длительностью сигнала (точке соответствует более короткий сигнал). Возможны варианты, когда точке и тире соответствуют импульсы тока или напряжения разной полярности. Такая схема исключает зависимость идентификации символа от длительности импульса. Максимальная скорость передачи классического телеграфа может составлять 950-1100 слов в час. В 1884 году начала функционировать телеграфная линия Вашингтон - Балтимор. Для линий связи в ту пору использовалась стальная проволока диаметром ~5мм. В качестве источников электроэнергии применялись батареи на напряжение 40-120 В. Импульсы тока имели амплитуду 10-25мА. Сама система являлась электромеханической и предполагала использование контактного ключа (вспомните шпионские фильмы периода второй мировой войны). Позднее ключ был заменен клавиатурой. Нажатие на определенную клавишу вызывало формирование последовательности сигналов, соответствующей определенной букве, что позволяло в несколько раз ускорить процедуру передачи. Такое устройство, получившее название телетайп, было предложено Кляйшмидтом и Моркрамом в 1915 году в США. На первых порах использовались электромеханические приемные устройства, которые печатали точки и тире, что было крайне неудобно. Позднее стали применяться устройства, которые могли дешифровать коды Морзе (или Бодо) и печатать на ленте буквы. Люди старшего поколения, возможно, еще помнят бланки телеграмм, на которые наклеены куски ленты с текстом, полученные от таких устройств.


Таблица 1.1. Коды Морзе

Код Морзе

Буквы

 

Код Морзе

Буквы и символы

Русские

Латинские

Русские

Латинские

•–

A

Aa

•– –

Я

Ää

–•••

Б

Bb

•–•–•–

Й

Jj

•–•–

В

Ww

– •–

ЪЬ

Xx

–•–•

Г

Gg

•–••

Э

Èè

–••

Д

Dd

•–•–•–•–

1

 



Е

Ee

•–•–•–

2

 

•••–

Ж

Vv

••–•–

3

 

–•–••

З

Zz

••••–

4

 

••

И

Ii

•••••

5

 

–•–

К

Kk

–••••

6

 

•–••

Л

Mm

–•–•••

7

 

–•–

М

Ll

–•–•–••

8

 

–•

Н

Nn

–•–•–•–•

9

 

–•–•–

О

Оо

–•–•–•–•–

0

 

•–•–•

П

Pp

••••••

. (точка)

 

•–•

Р

Rr

•–––

, (запятая)

 

•••

C

Ss

– –•–•

;

 



Т

Tt

– •–•–•••

:

 

••–

У

Uu

•–•••

?

 

••–•

Ф

Ff

–•–•–•–

!

 

••••

Х

Hh

–•–•–•–•–•–

/

 

–•–•

Ц

Сс

•–•–•– –

_

 

–•–•–•

Ч

Öö

•– – •

+ (конец)

 

–•–•–•–

Ш

Ch

–••• –

-

 

–•–•–

Щ

Qq

–••• –

Знак раздела

 

–•–•–

Ы

Yy

•– – –•–

Начало действия

 

••–•–

Ю

Üü

•••••••

Исправление ошибки

 


Телекоммуникационный канал содержал два провода (смотри рис. 1.1), по одному ток течет в одном направлении, по второму - в обратном. Понятно, что железо в качестве проводника не идеально (удельное сопротивление 8,8×10-6 Ом*см, да и склонность к ржавлению чего стоит), зато дешево. Лучше была бы медь или алюминий (1,56×10-6 и 2,45×10-6 Ом*см, соответственно). Еще лучше серебро - 1,51×10-6 Ом•см. Золото по своим электрическим свойствам занимает положение между медью и алюминием. Полагаю, не нужно пояснять, почему каналы коммуникаций никогда не делали из серебра и тем более из золота (и с медью мороки не оберешься…). Омическое сопротивление является причиной ослабления сигнала, что ограничивает предельное расстояние передачи по проводной линии. Это вынуждает на определенных расстояниях ставить станции ретрансляции.

Рассматривая таблицу кодов Морзе, следует обратить внимание на то, что наиболее часто используемые буквы имеют более короткие коды (это, прежде всего е, т, а, и, н и м). Это очень важный принцип, позволяющий увеличить среднюю скорость передачи данных. Он используется достаточно широко, можно, например, вспомнить принцип распределения символов на клавиатуре ЭВМ, в центре размещаются наиболее часто используемые буквы. Посмотрите на клавиатуру вашей ЭВМ, в центре и ближе к клавише пробела размещаются именно указанные выше буквы. Используется эта техника и при архивировании данных (алгоритм Хафмана). Кроме того, весьма важными являются паузы между буквами. Если пауза окажется малой, то трудно будет отличить НН от Ц, АА от Я и т.д. Распределение частот (вероятностей P) использования букв русского алфавита представлено в таблице 1.2.

Буква

P

Буква

P

пробел

0.175

я

0.018

о

0.9

ы

0.016

е,ё

0.072

з

0.016

а

0.062

ь,ъ

0.014

и

0.062

б

0.014

т

0.053

г

0.013

н

0.053

ч

0.012

с

0.045

й

0.01

р

0.04

х

0.009

в

0.038

ж

0.007

л

0.035

ю

0.006

к

0.028

ш

0.006

м

0.026

ц

0.004

д

0.025

щ

0.003

п

0.023

э

0.003

у

0.021

ф

0.002


Позднее были создано много других типов кодов (например, код Бодо для буквопечатающих аппаратов, ASCII или КОИ-8), в них, как правило, каждому символу или сигналу соответствует 5-8 бит. Сигналами отмечается, например, начало/конец передачи или исправление ошибки. Характерной особенностью ранних систем было отсутствие кодов для строчных букв. В мире много национальных алфавитов. Многие из них содержат специфические символы, достаточно вспомнить символьные набор китайского языка (в детстве меня занимал вопрос - как устроена китайская пишущая машинка). Чтобы решить проблемы кодирования национальных алфавитов был придуман уникод, где каждому символу ставится в соответствие два октета (байта). Это позволяет расширить многообразие символов с 256 до 65536.

Аналогичные принципы лежат в основе морских флажковых семафоров, где каждой букве соответствует определенное положение рук сигнальщика. Здесь можно также вспомнить французский семафор, изобретенный в 1830 году. Но это также как и сигнальные костры можно считать первыми приложениями, использующими передачу данных по оптическим каналам связи.

Коды Морзе использовались вплоть до второй половины двадцатого века. Их привлекательность была связана с ограниченностью требуемой полосы пропускания канала, а также с тем фактом что, для передачи были пригодны старые, довольно низкокачественные каналы.

Введя модуляцию на частоте 1500Гц (1936г), удалось получить до 24 телексных каналов по одному телефонному каналу с полосой 4 кГц (50бод). Позднее телексная сеть обрела самостоятельность и была окончательно вытеснена современными средствами связи лишь в конце 20-го века.

К 1950 годам большинство стран использовало три типа общедоступных сетей:
  1. Телеграфная сеть, которая просуществовала до конца 20-го века.
  2. Телефонная сеть (аналоговая), имеющая полосу 4 кГц и почти не менявшаяся по принципам работы с 1880 годов. Импульсная сигнальная система практически не изменялась с 1910 года.
  3. Телексная сеть, которая применялась в основном для делового обмена.

Рассмотрим причины того, что проводные системы связи, оставшиеся в наследство от телеграфа, мало пригодны для современных систем телекоммуникаций. Двухпроводные структуры, применявшиеся там, как правило, навешивались на телеграфные столбы или укладывались в виде кабелей в подземные каналы. Среднегеометрическое расстояние между проводами не было постоянным, более того, оно могло изменяться со временем, например, под действием ветра. Это приводило к тому, что волновые свойства такой структуры варьировались, а это с неизбежностью приводило к искажениям формы сигнала для длинных участков канала. Такие искажения ограничивали предельно возможную скорость передачи и длину канала без промежуточных ретрансляторов.

На первый взгляд прогресс в области электроники может снять проблему ослабления сигнала из-за омического сопротивления проводов, и исключить необходимость использования амплитуд сигналов порядка 40-100 вольт. Казалось бы, ставя промежуточные усилители, можно поддерживать амплитуду полезного сигнала в заданных пределах. Идеальным примером такого решения может служить трансокеанские телефонные кабели.


Беда в том, что ослабление сигнала из-за резистивных потерь не сопровождается ослаблением шума в канале. Усилители же увеличивают уровень шума пропорционально своему коэффициенту передачи. По этой причине рано или поздно средние значения амплитуд сигнала и шума могут сравняться.


Конечно, по пути транспортировки данных и на принимающей стороне предпринимаются усилия по фильтрации шума. Так как тепловые шумы достаточно высокочастотны в случае телеграфии или телефонии можно существенно улучшить отношение сигнал/шум простым подавлением высокочастотной составляющей сигнала.

Передача данных по протяженным каналам через пустынные области, например, по дну океана, как было отмечено выше, требуют наличия усилителей, а усилители нуждаются в питании. Обычно питание передается по тому же кабелю, и здесь также вмешиваются омические потери.

Известно, что в оптоволокне сигнал подвергается меньшему погонному ослаблению, чем в медном проводе. Было бы замечательно, если бы был найден способ, передавать энергию для опто-электрических усилителей по оптическому волокну.

Интернет является сетью виртуальных сетей. В 1991 году у нас (тогда еще в СССР) о нем знали несколько десятков человек, которые только что освоили электронную почту (через RELCOM) и попробовали, что такое FidoNet. Первое сообщение по электронной почте было послано президентом США Биллом Клинтоном 2 марта 1993 года. Первая новелла Стивена Кинга была опубликована по каналам Интернет 19 сентября 1993 года (до появления печатной копии), к тому же году относится начало синхронной передачи радио-программ по сетям Интернет. В конце 1993 года заработала первая очередь оптоволоконной опорной сети Москвы, полностью профинансированная Джорджем Соросом. В 1994 году НАТО организовало первую конференцию по Интернет в России (в Голицыно под Москвой). С помощью DFN (Deutsche Forschung Naetze), а затем Дж. Сороса и RELARN круг любителей Интернет расширился до сотен и тысяч, а после включения программ Минвуза и Министерства науки РФ счет пошел на десятки тысяч. Это произошло прежде всего потому, что созрели условия - в различных учреждениях (сначала научных, а затем коммерческих и государственных) и у частных лиц оказались сотни тысяч персональных ЭВМ. К этому же времени (1992-93 годы) в мире стала формироваться сеть депозитариев, доступных через анонимный доступ (FTP), а несколько позднее и WWW-серверов. На рис. 1.1 показан рост числа ЭВМ, подключенных к Интернет по годам с 1989 по 1998 годы. Видно, что рост числа узлов сети имеет экспоненциальный характер. Можно смело утверждать, что протоколы Интернет, созданные для осуществления связи в случае нанесения десятков ядерных ударов по США со стороны СССР, явились одним из немногих (возможно единственным) положительным результатом холодной войны.



Рис. 1.1. Рост числа ЭВМ, подключенных к Интернет в период 1989-98 годы (по вертикальной оси отложено число ЭВМ в миллионах)

Сегодня, когда Интернетом заинтересовались широкие массы трудящихся, и определенная часть их подключилась к расширению этой сети, стала актуальной проблема оптимального проектирования сетей и их подключения к общенациональной и международной сети Интернет. К концу 2005 года число узлов, подключенных к Интернет превысило миллиард. Прогнозируется, что к 2011 году число таких узлов достигнет полутора миллиардов (что составит 22% населения Земли).

Современные сети Интернет объединяют в единое целое многие десятки (а может быть уже и сотни) тысяч локальных сетей по всему миру, построенных на базе самых разных физических и логических протоколов (Ethernet, Token Ring, ISDN, X.25, Frame Relay, Arcnet и т.д.). Эти сети объединяются друг с другом с помощью последовательных каналов (протоколы SLIP, PPP), сетей ATM, SDH (Sonet), Fibre Channel и многих других. В самих сетях используются протоколы TCP/IP (Интернет), IPX/SPX (Novell), Appletalk, Decnet, Netbios и бесконечное множество других, признанных международными, являющихся фирменными и т.д. Картина будет неполной, если не отметить многообразие сетевых программных продуктов. На следующем уровне представлены разнообразные внутренние (RIP, IGRP, OSPF) и внешние (BGP и т.д.) протоколы маршрутизации и маршрутной политики, конфигурация сети и задание огромного числа параметров, проблемы диагностики и сетевой безопасности. Немалую трудность может вызвать и выбор прикладных программных средств (Netscape, MS Internet Explorer и пр.). В последнее время сети внедряются в управление (CAN), сферу развлечений, торговлю, происходит соединение сетей Интернет и кабельного телевидения.

Что явилось причиной стремительного роста сети Интернет? Создатели базовых протоколов (TCP/IP) заложили в них несколько простых и эффективных принципов: инкапсуляцию пакетов, фрагментацию/дефрагментацию сообщений и динамическую маршрутизацию путей доставки. Именно эти идеи позволили объединить сети, базирующиеся на самых разных операционных системах (Windows, Unix, Sunos/Solaris и пр.), использующих различное оборудование (Ethernet, Token Ring, FDDI, ISDN, ATM, SDH и т.д.) и сделать сеть нечувствительной к локальным отказам аппаратуры. Огромный размер современной сети порождает ряд серьезных проблем. Любое усовершенствование протоколов должно проводиться так, чтобы это не приводило к замене оборудования или программ во всей или даже части сети. Достигается это за счет того, что при установлении связи стороны автоматически выясняют сначала, какие протоколы они поддерживают, и связь реализуется на общем для обеих сторон наиболее современном протоколе (примером может служить использование расширения протокола SMTP - MIME). В кабельном сегменте современной локальной сети можно обнаружить пакеты TCP/IP, IPX/SPX (Novell), Appletalk, которые успешно сосуществуют.

Проектировщикам и создателям сетей приходится учитывать многие десятки факторов при выборе того или иного типа сети, сетевого оборудования, операционной системы (UNIX, MS-DOS, IRIS, Windows-NT/XP/VISTA, SOLARIS или что-то еще), программного обеспечения, внешних каналов связи (выделенный канал, коммутируемая телефонная сеть, цифровая сеть, радио или спутниковый канал) и в конце концов сервис-провайдера. За всем этим стоят как технологические проблемы, так и финансовые трудности, тяжелый выбор между дешевой и хорошей сетью.

Если вас интересуют оригинальные тексты протоколов Интернет, вы можете получить их, например, через анонимное FTP по адресу ds.internic.net (в каталоге RFC) . Эти документы можно найти и в других депозитариях.

Документы RFC делятся на стандарты, проекты стандартов, временные (экспериментальные) регламентации и предложения. Чем больше номер RFC, тем более поздней дате этот документ соответствует. О статусе тех или иных RFC можно узнать из RFC-1500 и -1780 (см. также файл std-inde.txt из того же депозитария, что и rfc-index.txt). Если вы хотите найти какой-то RFC-документ, начните с просмотра индексного файла (напр. rfc-index.txt). Первый документ RFC был выпущен в 1969 году около 40 лет тому назад. Далее темп публикаций варьировался в довольно широких пределах, в 1997-99 годах наблюдается заметный всплеск активности, связанный с потребностями мультимедиа (RTP, RSVP, PIM и т.д.), безопасностью и IPv6. Вариация публикаций документов RFC по годам представлена на рис 1.2.



Рис. 1.2. Распределение публикаций документов RFC по годам с 1969 по 1999

Из этого распределения видно, что к 1979 году окончательно сформировался стек базовых протоколов и начался экстенсивный рост сети Интернет. По мере выявления недостатков протоколов и новых потребностей после 1989 года началась активная разработка новых направлений и приложений в Интернет.

Но все по порядку. Начнем с того, как устроен Интернет. На рис. 1.3 показана общая схема, которая облегчит дальнейшее обсуждение данной проблематики (буквами R отмечены маршрутизаторы-порты локальных сетей).

Каждая из сетей, составляющих Интернет, может быть реализована на разных принципах, это может быть Ethernet (наиболее популярное оборудование), Token Ring (вторая по популярности сеть), ISDN, X.25, FDDI или Arcnet. Все внешние связи локальной сети осуществляются через порты-маршрутизаторы (R). Если в локальной сети использованы сети с разными протоколами на физическом уровне, они объединяются через специальные шлюзы (например, Ethernet-Fast_Ethernet, Ethernet-Arcnet, Ethernet-FDDI и т.д.). Выбор топологии связей определяется многими факторами, не последнюю роль играет надежность. Использование современных динамических внешних протоколов маршрутизации, например BGP-4, позволяет автоматически переключаться на один из альтернативных маршрутов, если основной внешний канал отказал. Поэтому для обеспечения надежности желательно иметь не менее двух внешних связей. Сеть LAN-6 (см. рис. 1.3) при выходе из строя канала R2-R6 окажется изолированной, а узел LAN-7 останется в сети Интернет даже после отказа трех внешних каналов.

Широкому распространению Интернет способствует возможность интегрировать самые разные сети, при построении которых использованы разные аппаратные и программные принципы. Достигается это за счет того, что для подключения к Интернет не требуется какого-либо специального оборудования (маршрутизаторы не в счет, ведь это ЭВМ, где программа маршрутизации реализована аппаратно). Некоторые протоколы из набора TCP/IP (ARP, SNMP) стали универсальными и используются в сетях, построенных по совершенно иным принципам. Впрочем в последние годы стали появляться все чаще устройства, где программные стредства TCP/IP реализуются аппаратным образом.



Рис. 1.3. Схема построения сети Интернет

В некотором смысле Интернет возник эволюционно - в начале был Bitnet, fidonet, usenet и т.д. Со временем стало ясно, что конкуренция сетей должна быть заменена их объединением, так как от этого выигрывают все и пользователи и сервис-провайдеры. Ведь объединенная сеть имеет большие информационные ресурсы, может предложить более широкий список услуг и становится по этой причине привлекательной для еще большего числа клиентов.

Технология WWW-серверов сделала Интернет важной средой для целевой рекламы, приближенной к конечному потребителю. Стремительный рост числа узлов www продемонстрирован на рис. 1.4. Здесь также наблюдается экспоненциальный рост. Число активных узлов примерно в два раза меньше числа зарегистрированных (это же мы наблюдаем в нашей локальной сети). Сам факт использования Интернет для обливания грязью кандидатов во время предвыборной компании, говорит о том, что эта технология освоена и признана эффективной нашими политиками. Наше общество с удивительным упорством сначала осваивают все негативное, оставляя, очевидно, позитивное на десерт.



Рис. 1.4. Рост числа узлов WWW в период 1994-2005 годы
(получено по подписке из announce@beta.netcraft.com)

В перспективе Интернет может стать и всемирной ярмаркой товаров и услуг. Ведь клиент может не только увидеть изображение товара и ознакомиться с условиями поставки, но и в диалоговом режиме получить ответы на интересующие его вопросы, а затем одним нажатием на клавишу мышки сделать заказ на понравившийся ему товар или услугу. В принципе для этого не нужен даже номер кредитной карточки, его заменит зашифрованный соответствующим образом идентификатор пользователя (сертификат) или его IP-адрес (если он работает на своей домашней машине). Таким образом, можно будет заказывать билеты на самолет или в театр, планировать программу своего телевизора на неделю вперед и т. д.

Современные системы мультимедиа позволяют совместить телевизор, видеомагнитофон, факс и видеотелефон, причем это не фантазия на тему далекого будущего - это услуги доступные уже сегодня (при наличии широкополосного канала связи (64-512 Кбит/с)). Если вы имеете доступ к Интернет, вам уже не нужно платить за международные телефонные переговоры, вы можете сделать это с помощью ip-phone, skype или другого аналогичного продукта, при условии что ваш партнер также имеет доступ к Интернет (данное требование в ближайшем будущем перестанет быть обязательным). Все более широкий круг услуг предлагает Интернет и в сфере развлечений. Здесь имеются игровые серверы, аренда обычных и сетевых компьютерных игр, различные конкурсы и соревнования.

Теперь рассмотрим, как строятся каналы связи (стрелки на рис. 1.5). В простейшем случае связь можно организовать через городскую коммутируемую телефонную сеть, для этого нужны модемы - по одному на каждой из сторон канала (Рис. 1.5a). Традиционные модемы могут обеспечить при хорошем качестве коммутируемой аналоговой телефонной сети пропускную способность до 56 Кбит/с (кабельные широкополосные модемы при длине соединения порядка 2км могут обеспечить 2 Мбит/с). Привлекательность такого решения заключается в возможности подключения к любому узлу, имеющему модемный вход. Наиболее широко указанный метод связи используется для подключения к узлам Интернет домашних ЭВМ. Недостатком такого решения является низкая надежность канала (особенно в России), малая пропускная способность и необходимость большого числа входных телефонных каналов и модемов.

Использование выделенной 2- или 4-проводной линии (рис. 1.5Б) обеспечивает большую надежность и пропускную способность (до 256 кбит/с при длинах канала < 10 км). Но и здесь на каждый вход требуется отдельный модем, да и скоростные модемы, работающие на выделенную линию, относительно дороги. Выделенные линии чаще служат для межсетевого соединения (рис. 1.5В). Функциональным аналогом выделенных линий являются оптоволоконные, спутниковые и радио-релейные каналы. Этот вариант позволяет строить сети с пропускной способностью в несколько 1-100 Мбит/с и более.

Привлекательные возможности предлагают цифровые сети ISDN. Здесь можно использовать групповые телефонные номера, когда пара модемов обслуживает 10 и более пользователей (ведь они работают, как правило, не все одновременно). Кроме того, ISDN предлагает пользователям каналы с пропускной способностью не ниже 64кбит/c, а при необходимости возможно формирование и более широкополосных каналов. ISDN позволяет делить один и тот же канал между многими пользователями для передачи данных, факсов и телефонных переговоров. isdn органично стыкуется с внешними каналами X.25. К недостаткам системы следует отнести ограниченность ширины окна (число переданных пакетов без получения подтверждения приема), что делает неэффективным использование широкополосных и особенно спутниковых каналов. В области межсетевых связей свою нишу занимает Frame Relay. Этот протокол имеет контроль перегрузок, работающий на аппаратном уровне



Рис. 1.5. Схемы каналов, использующих городскую телефонную сеть

На рис. 1.5 показана схема построения сети с использованием исключительно соединений типа точка-точка. Это наиболее часто встречающийся, но не единственный вариант. Дорога 'от околицы до околицы' прокладывается там, где она нужна и теми, кому она нужна непосредственно, но, согласитесь, построить так магистраль Москва Санкт-Петербург нельзя. При построении крупных общенациональных и интернациональных сетей применяются сверхширокополосные каналы и схемы типа опорной сети (backbone). Узлы такой сети могут располагаться в каких-то крупных организациях или быть самостоятельными (принадлежать государственным PTT). Такие сети обычно базируются на протоколах SDH (Sonet). Информация в этих сетях передается в виде больших блоков (виртуальных контейнеров). Использование опорной сети обычно оправдано при организации интернациональных связей, но бывают и исключения. Примером такого исключения является Московская опорная сеть, построенная на основе FDDI (100Мбит/с) и объединяющая более десяти научных организаций (длина первой очереди около 30 км). Московская сеть выполнена по схеме с 'прозрачными' IP-мостами, обычно же более мощные опорные сети маршрутизируемы, то есть блоки данных адресуются конкретным узлам, где они разбираются и сортируются. Контейнер может содержать сообщения, адресованные разным получателям, что несколько противоречит идеологии протоколов TCP/IP. IP-пакеты могут вкладываться в эти контейнеры и транспортироваться до заданного узла опорной сети. Классическим примером опорной сети является E-bone (Европейская опорная сеть). Эта сеть объединяет 27 стран (России в этом списке нет) и более 60 сервис-провайдеров, пропускная способность для различных участков лежит в пределах 2-34Мбит/с. Опорная сеть подобна международной автомагистрали, по ней добираются до ближайшего к точке назначения узла, а далее по 'проселочным' каналам до конечного адресата.