World Wide Web Введение
Вид материала | Документы |
- Введение. Из истории сетевых технологий, 341.5kb.
- «История Интернет», 57.92kb.
- Юридические аспекты применения сети Интернет в России Введение, 1695.12kb.
- Утина (World Wide Web или сокращенно www) название самого распространенного на сегодняшний, 335.68kb.
- Всемирная паутина. Файловые архивы. Поиск информации в сети Интернет, 167.86kb.
- Монография: Позитивная семиотика (о знаках, знаковых системах и семиотической деятельности), 2604.26kb.
- Transmission Control Protocol / Internet Protocol (Протоколы управления процессом передачи, 479.59kb.
- Лабораторная работа, 157.58kb.
- Роль Интернет-услуг в практической маркетинговой деятельности, 294.77kb.
- 1 Призначення html, 333.23kb.
Путешествие по WWW
Как в WWW задается местонахождение документа?
Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысяч серверов. Задача WWW-путешественника — найти среди них тот, который содержит необходимую информацию, и прочитать его при помощи программы просмотра, а для этого программа просмотра должна знать точное местонахождение данного документа. Оно однозначно определяется адресом сервера, номером порта, именем директории и именем файла с этим документом. Для успешной загрузки требуемого документа с сервера программе просмотра также нужно указать протокол, используемый этим сервером. Это связано с тем, что кроме WWW-серверов, программы просмотра могут обращаться к серверам пересылки файлов (так называемым FTP-серверам), серверам телеконференций, серверам электронной почты и некоторым другим типам серверов. Комбинация протокола, адреса сервера, номера порта, имени директории и имени файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис URL показан ниже:
протокол://адрес_сервера:номер_порта/имя_директории/имя_файла
Рассмотрим составляющие URL на конкретном примере:
iuc.edu:80/~dima/index.phpl
Протокол, как уже было сказано выше, — это совокупность правил, по которым происходит взаимодействие клиент–сервер. Мы уже знаем, что "родной" протокол WWW называется http. Кроме http, WWW-клиенты могут общаться c серверами, поддерживающими протоколы ftp, gopher и некоторыми другими, на которых мы здесь останавливаться не будем, а расскажем о них далее по мере необходимости. Название протокола отделяется от остальной части URL двоеточием. В названии протокола прописные латинские буквы и соответствующие им строчные буквы эквивалентны.
Адрес сервера (address, или host name), для тех, кто знаком с системой адресации электронной почты в Internet, выглядит знакомо. Начало адреса отмечается двумя косыми чертами «//». Он состоит из нескольких частей (не обязательно четырех, как в нашем примере) — так называемых поддоменов (subdomains). Поддомены, представляющие собой сочетания букв и цифр, разделяются точками, причем, "уточнение координат адресата" от более крупных к более мелким поддоменам происходит справа налево. Так же как и в названии протокола, в адресе сервера прописные латинские буквы и соответствующие им строчные буквы эквивалентны.
В приведенном выше примере URL адрес принадлежит WWW-серверу Химического факультета Университета штата Иллинойс в Урбана-Шампейн (School of Chemical Sciences at the University of Illinois at Urbana-Champaign). Давайте взглянем на него более пристально.
www.scs.uiuc.edu
4 3 2 1
1. edu - домен верхнего уровня. Он обозначает либо код страны, либо, как в данном случае, код сети. edu - это код сети высших учебных заведений США. Часто встречаются также следующие домены верхнего уровня: gov - правительственные организации США, mil - вооруженные силы США, com - коммерческие организации, net - сетевые службы Internet, org - некоммерческие организации, su - страны СНГ.
2. uiuc.edu - поддомен второго уровня. Имена поддоменов второго уровня утверждаются в соответствии с правилами, выработанными доменами верхнего уровня. В данном случае, аббревиатура означает University of Illinois at Urbana-Champaign.
3. scs.uiuc.edu - поддомен третьего уровня. Имена поддоменов третьего уровня утверждаются в соответствии с правилами, выработанными доменами второго уровня. В нашем примере scs означает School of Chemical Sciences.
4. www.scs.uiuc.edu - поддомен четвертого, в данном случае, самого младшего, уровня. Аналогично, имена поддоменов четвертого уровня утверждаются в соответствии с правилами, выработанными доменами третьего уровня. В нашем примере поддомен назван www, потому что на данной машине расположен WWW-сервер. Заметим, что адреса WWW-серверов довольно часто, но далеко не всегда, начинаются с www.
Номер порта выражается целым положительным числом и отделяется от адреса двоеточием. Порт - это как бы "дверь", через которую можно зайти в сервер. Сервер может иметь несколько доступных портов; если номер порта WWW-сервера равен 80, то в URL его можно не указывать.
Имя директории и имя файла для пользователей IBM PC - совместимых компьютеров с операционной системой DOS выглядят знакомо. Однако, в связи с тем, что подавляющее большинство серверов WWW работает под управлением операционной системы UNIX, в URL имеют место следующие отличия от DOS'овского стиля:
- Не указывается имя дисковода.
- Имена файлов и директорий могут быть гораздо длиннее скудно отпущенных DOS восьми символов (+ трех символов расширения), например: data_on_radiolysis_of_methanol.dat
- В именах директорий и файлов прописные и строчные символы различаются. Например, Letter.txt и letter.txt являются различными файлами.
- Имена файлов и директорий могут содержать несколько точек. Часть имени, следующая за последней встречающейся точкой, обычно называется суффиксом (suffix), или расширением (extension). Расширение, как правило, указывает на тип файла. Например, приведенное ниже имя файла с графической информацией в формате GIF имеет суффикс gif: picture.dog1.gif
- Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .phpl или .php. Эти суффиксы являются аббревиатурой от названия языка, на котором пишут WWW-документы, HyperText Markup Language.
- Поддиректории разделяются не обратной косой чертой «\», а прямой «/». Например: /usr/staff/data/
- Если имя директории начинается с символа ~ (тильда), это означает, что это - так называемая домашняя директория (home directory) пользователя данной компьютерной системы. На компьютерах с многопользовательской операционной системой UNIX каждому пользователю присваивается имя пользователя (login name), под которым он регистрируется в системе, и выделяется собственная "домашняя" директория, предназначенная для хранения принадлежащих ему файлов. Имя домашней директории совпадает с именем пользователя. Вместо абсолютного имени домашней директории с указанием всех ее поддиректорий можно использовать имя пользователя, которому предшествует символ ~ (тильда). Например, если директория /fuji1/people/dima/ является домашней директорией пользователя с именем dima, то ее можно записывать просто как ~dima/
Обратите внимание на следующие особенности задания имен директорий и файлов в URL:
- Директория, указанная в URL, как правило, не совпадает с истинной директорией в файловой системе на том сервере, где находится требуемый файл. Преобразование директорий, заданных в URL, в истинные директории в файловой системе осуществляется WWW-сервером согласно правилам, заданным при его установке и настройке. В частности, файл index.phpl, доступный по URL iuc.edu:80/~dima/index.phpl в действительности расположен в директории /fuji1/people/dima/public_html/, а в URL указывается лишь ~dima/.
- Если в URL указано только имя директории, а имя файла не задано, то сервер на такой запрос вышлет файл с определенным именем, зависящим от настройки сервера, - обычно index.phpl или welcome.phpl. Если же такого файла в заданной директории нет, то большинство серверов автоматически вышлют вам список всех файлов в данной директории. Например, URL iuc.edu:80/~dima/index.phpl эквивалентен следующему, в котором опущен номер порта (80 - номер порта, принимаемый по умолчанию) и имя файла (данный сервер настроен так, чтобы высылать index.phpl): iuc.edu/~dima/. Обратите внимание на косую черту, которой заканчивается имя директории! Ее нельзя опускать, даже если в URL имя файла не указано.
"Ну и ну," - скажет читатель, - "со всеми этими правилами насчет директорий и файлов и запутаться недолго!" На самом деле все это не так уж сложно, как кажется на первый взгляд, - ведь применять описанные выше правила пользователю WWW практически никогда не приходится. Представьте себе, что вы просматриваете некоторый документ в WWW, и в этом документе находите гиперсвязь с интересующим вас другим документом - тогда программа просмотра по вашему желанию загрузит его автоматически, и вам даже не обязательно знать соответствующий URL. Возможен и другой вариант: вам кто-либо сообщил URL документа, который мог бы вас заинтересовать. В этом случае необходимо всего лишь ввести этот URL в программу просмотра без опечаток. О программах просмотра и работе с ними мы поговорим в следующем разделе, а этот раздел завершим списком наиболее часто встречающихся опечаток при вводе URL с клавиатуры:
- Пробелы между символами, входящими в URL.
- Использование обратной косой черты «\» вместо прямой «/».
- Пропуск или замена символа ~ (тильда) на какой-либо другой символ.
- Замена строчных букв на прописные и наоборот в именах директорий и файлов.
- Замена строчной латинской буквы l на цифру 1 и наоборот, а также замена буквы o на цифру 0, латинской буквы c на русскую букву с, латинской буквы p на русскую букву р и т. п.
- Пропуск последней косой черты, следующей за именем директории, в случае, когда в URL не указывается имя файла.