Поисковые системы

Вид материалаДокументы

Содержание


3. Поисковые роботы
Использование поисковых роботов
1. Статистический Анализ
2. Обслуживание гипертекстов
3. Исследование ресурсов
Средства разработки Web сайтов
Язык разметки HTML.
С чего начинается HTML
Правильный пример самого короткого HTML-документа
Вставка комментариев
Заголовок HTML-документа
Элементы, относящиеся к заголовку документа
STYLE Используется для вставки в документ таблицы стилей CSS Атрибуты
TITLE – определяет имя создаваемой таблицы стилей. Необходим, если вы собираетесь использовать несколько элементов STYLE
LINK Описывает взаимосвязь документа с другими объектами Элемент LINK
CONTENT – присваивает значение мета-записи, определенной в атрибуте NAME (или HTTP-EQUIV).   Пример
Элементы для создания фреймов и работы с ними
BORDER – определяет ширину рамок фреймов в пикселах. Данный атрибут действует только в браузерах Netscape; FRAMEBORDER
Yes – отображать рамки;No
SRC – обязательный атрибут. Указывает адрес (URL) HTML-файла, отображаемого в данном фрейме. NAME
...
Полное содержание
Подобный материал:

Поисковые системы

Поисковые cистемы обычно состоят из трех компонент:
  • агент (паук или кроулер), который перемещается по Сети и собирает информацию;
  • база данных, которая содержит всю информацию, собираемую пауками;
  • поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Как работают механизмы поиска

Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы.
  • Агенты - самые "интеллектуальные" из поисковых средств. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.
  • Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.
  • Кроулеры просматривают заголовки и возвращают только первую ссылку.
  • Роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети. Однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.

База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке. Различные поисковые системы используют различные алгоритмы ранжирования, однако, основные принципы определения релевантности следующие:
  1. Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).
  2. Тэги, в которых эти слова располагаются.
  3. Местоположение искомых слов в документе.
  4. Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

Эти принципы применяются всеми поисковыми системами. А представленные ниже используются некоторыми, но достаточно известными (вроде AltaVista, HotBot).
  1. Время - как долго страница находится в базе поискового сервера. Поначалу кажется, что это довольно бессмысленный принцип. Но, если задуматься, как много существует в Интернете сайтов, которые живут максимум месяц! Если же сайт существует довольно долго, это означает, что владелец весьма опытен в данной теме и пользователю больше подойдет сайт, который пару лет вещает миру о правилах поведения за столом, чем тот, который появился неделю назад с этой же темой.
  2. Индекс цитируемости - как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой.

Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

2.2 Сравнительный обзор поисковых систем

Lycos. В Lycos используется следующий механизм индексации:
  • слова в заголовке имеют высший приоритет; <br /> <li>слова в начале страницы; <br /> <li>слова в ссылках; <br /> <li>если в его базе индекса есть сайты, ссылка с которых указывает на индексируемый документ - релевантность этого документа возрастает. <br /> </ul> <br /> Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний. <br /> <br /><i><b>AltaVista</b></i>. Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты: <br /> <ul> <li>слова содержащиеся в теге <title> имеют высший приоритет; ключевые фразы в <Meta> тэгах; <br /> <li>ключевые фразы, находящиеся в начале странички; <br /> <li>ключевые фразы в ALT - ссылках <br /> <li>ключевые фразы по количеству вхождений\присутствия слов\фраз; <br /> </ul> <br /> Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description) <br /> <br /> <i><b>Yahoo</b></i>. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска. <br /> <br /> <i><b>OpenText</b></i>. Информационная система OpenText представляет собой самый коммерциализированный информационный продукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет провести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами. В данном случае речь идет о расширенном поиске. При выдаче результатов сообщается степень соответствия документа запросу и размер документа. Система позволяет также улучшить результаты поиска в стиле традиционного булевого поиска. OpenText можно было бы отнести к разряду традиционных информационно-поисковых систем, если бы не механизм ранжирования. <br /> <br /><i><b>Infoseek</b></i>. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты: <br /> <ul> <li>слова в заголовке <title> имеют наивысший приоритет; <br /> <li>слова в теге keywords, description и частота вхождений\повторений в самом тексте; <br /> <li>при повторении одинаковых слов рядом выбрасывает из индекса <br /> <li>Допускает до 1024 символов для тега keywords, 200 символов для тэга description; <br /> <li>Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание; <br /> </ul> <br /> Система Infoseek обладает довольно развитым информационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске. <br /> <br /> <i><b>WAIS</b></i>. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet. <br /> <h4>3. Поисковые роботы</h4> <br /> За последние годы Всемирная паутина стала настолько популярной, что сейчас Интернет является одним из основных средств публикации информации. Когда размер Сети вырос из нескольких серверов и небольшого числа документов до огромных пределов, стало ясно, что ручная навигация по значительной части структуры гипертекстовых ссылок больше не представляется возможной, не говоря уже об эффективном методе исследования ресурсов. <br /> <br /> Эта проблема побудила исследователей Интернет на проведение экспериментов с автоматизированной навигацией по Сети, названной "роботами". Веб-робот - это программа, которая перемещается по гипертекстовой структуре Сети, запрашивает документ и рекурсивно возвращает все документы, на которые данный документ ссылается. Эти программы также иногда называют "пауками", " странниками", или "червями" и эти названия, возможно, более привлекательны, однако, могут ввести в заблуждение, поскольку термин "паук" и "странник" создает ложное представление, что робот сам перемещается, а термин "червь" мог бы подразумевать, что робот еще и размножается подобно интернетовскому вирусу-червю. В действительности, роботы реализованы как простая программная система, которая запрашивает информацию из удаленных участков Интернет, используя стандартные cетевые протоколы. <br /> <br /><b> Использование поисковых роботов</b> <br /> <br /> Роботы могут использоваться для выполнения множества полезных задач, таких как статистический анализ, обслуживание гипертекстов, исследования ресурсов или зазеркаливания страниц. Рассмотрим эти задачи подробнее. <br /> <br /><b> 1. Статистический Анализ</b> <br /> <br /> Первый робот был создан для того, чтобы обнаружить и посчитать количество веб-серверов в Сети. Другие статистические вычисления могут включать среднее число документов, приходящихся на один сервер в Сети, пропорции определенных типов файлов на сервере, средний размер страницы, степень связанности ссылок и т.д. <br /> <br /><b> 2. Обслуживание гипертекстов</b> <br /> <br /> Одной из главных трудностей в поддержании гипертекстовой структуры является то, что ссылки на другие страницы могут становиться "мертвыми ссылками" в случае, когда страница переносится на другой сервер или совсем удаляется. На сегодняшний день не существует общего механизма, который смог бы уведомить обслуживающий персонал сервера, на котором содержится документ с ссылками на подобную страницу, о том, что она изменилась или вообще удалена. Некоторые серверы, например, CERN HTTPD, будут регистрировать неудачные запросы, вызванные мертвыми ссылками наряду с рекомендацией относительно страницы, где обнаружена мертвая ссылка, предусматривая что данная проблема будет решаться вручную. Это не очень практично, и в действительности авторы документов обнаруживают, что их документы содержат мертвые ссылки лишь тогда, когда их извещают непосредственно, или, что бывает очень редко, когда пользователь сам уведомляет их по электронной почте. <br /> <br /> Робот типа MOMSPIDER, который проверяет ссылки, может помочь автору документа в обнаружении подобных мертвых ссылок, и также может помогать в обслуживании гипертекстовой структуры. Также роботы могут помочь в поддержании содержания и самой структуры, проверяя соответствующий HTML-документ, его соответствие принятым правилам, регулярные модернизации, и т.д., но это обычно не используется. Возможно, данные функциональные возможности должны были бы быть встроены при написании окружающей среды HTML-документа, поскольку эти проверки могут повторяться в тех случаях, когда документ изменяется, и любые проблемы при этом могут быть решены немедленно. <br /> <br /><b> 3. Исследование ресурсов</b> <br /> <br /> Возможно, наиболее захватывающее применение роботов - использование их при исследовании ресурсов. Там, где люди не могут справиться с огромным количеством информации, довольно возможность переложить всю работу на компьютер выглядит довольно привлекательно. Существует несколько роботов, которые собирают информацию в большей части Интернет и передают полученные результаты базе данных. Это означает, что пользователь, который ранее полагался исключительно на ручную навигацию в Сети, теперь может объединить поиск с просмотром страниц для нахождения нужной ему информации. Даже если база данных не содержит именно того, что ему нужно, велика вероятность того, что в результате этого поиска будет найдено немало ссылок на страницы, которые, в свою очередь, могут ссылаться на предмет его поиска. <br /> <br /> Второе преимущество состоит в том, что эти базы данных могут автоматически обновляться за определенный период времени так, чтобы мертвые ссылки в базе данных были обнаружены и удалены, в отличие от обслуживания документов вручную, когда проверка часто является спонтанной и не полной. Использование роботов для исследования ресурсов будет обсуждаться ниже. <br /> <h2>Средства разработки Web сайтов</h2> <br /><br />Средства разработки состоят из среды разработки и языка разработки.<br /><br /><ol> <ol> <li> <b> Язык разметки HTML.</b><br /> </ol> </ol> <br />(Это основной инструмент разработки Web сайтов).<br /> <br /> <u><b>Язык разметки </b></u><u><b>HTML</b></u> – это система команд, основная задача которой – представление текстовых и мультимедийных элементов Web страницы в наиболее благоприятной для восприятия форме.<br /> <br /> (Первую часть определения можно отнести к любому языку разметки). В дополнение к командам разметки в язык HTML были добавлены команды для работы с гиперссылками.<br /> <br /> <u>Язык </u><u>HTML</u><u> позволяет</u>: <br /> <ol> <li> Разместить элементы Web страницы в удобной для восприятия форме:<br /> <ul> <li> Установить тип текстовых фрагментов, их стиль.<br /> <li> Использовать в составе Web станицы элементы сложного форматирования (таблицы, списки и так далее).<br /> </ul> </ol> <br /> <br /> <ol start=2> <li> Определять предназначение Web страницы в целом, отдельные ее свойства (кодировка, сроки использования); параметры взаимоотношения данной Web страницы с другими Web документами (наследование).<br /> </ol> <br /> <br /> <br /> <ol start=3> <li> Поддерживать интерактивное взаимодействие с Web сайтом (это реализуется с помощью форм).<br /> </ol> <br /> <br /> <br /> <ol start=4> <li> Переходить к другим Web документам посредством гиперссылок.<br /> </ol> <br /><br /><b> С чего начинается HTML</b><br /> <br />Для того, чтобы текстовый файл превратился в HTML-файл, поменять его расширение с ".txt" на ".php" недостаточно. Надо соблюсти "правило первой строки": <br /> <br />Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, обязан начинаться со строки декларации версии HTML <b>!DOCTYPE</b>, которая обычно выглядит так: <br /> <br /> HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <br /> <br /> Эта строка поможет браузеру определить, как правильно интерпретировать данный документ. В данном случае мы говорим браузеру, что HTML соответствует международной спецификации версии 3.2, которая хоть и не отличается новизной, но, в отличие от более поздних версий, является полноценным, широко распространенным стандартом без каких-либо неопределенностей. Как видно из примера, самый короткий html-документ состоит буквально из одной строки. <br /><br /><br />На самом деле одной строкой дело не обходится. После объявления версии и типа документа необходимо обозначить его начало и конец. Это делается с помощью тега-контейнера <HTML>. Необходимо отметить, что любой HTML-документ открывется тегом <HTML> и им же закрывается. <br /> <br />Затем, между тегами <HTML> и </HTML> следует разместить заголовок и тело документа. Вот и все! Начало положено – вы получили прекрасную заготовку. Вот как должен выглядеть ваш базовый HTML-файл перед началом работы: <br /><br /><br />  <b> Правильный пример самого короткого HTML-документа:</b><br /> <br />     <br /> <br /><br /><HTML><br />    <HEAD><br />    <TITLE>Заголовок документа
       

    Текст документа



    Из схемы видно, что документ состоит из двух основных блоков – "заголовка" и "тела документа". Заголовок определяется с помощью элемента HEAD, а тело – элементом BODY.

    Заголовок содержит "техническую" информацию о документе, хотя чаще всего используется только для обозначения его названия (см. элемент TITLE).

    Тело документа – святая святых. Именно в нем находится все то, что отображается на странице: текст, картинки, таблицы. Соответственно, делаем вывод: большинство ваших HTML-экспериментов будет проводиться в пространстве между тегами и 

    Вставка комментариев


    Используется для создания комментариев в любой части документа. Все, что находится внутри -->, будь то элемент или текст – будет проигнорировано браузером (не будет обрабатываться и выводиться на экран).

    Заголовок HTML-документа


    Создается с помощью элемента ссылка скрыта, между тегами которого размещаются элементы, содержащие техническую информацию о документе. Заголовок обычно располагается до тела документа.


    Элементы, относящиеся к заголовку документа:
    • HEAD: ….

    Определяет начало и конец заголовка документа. Является контейнером для элементов, содержащих техническую информацию о документе.
    • TITLE: …..

    Определяет имя всего документа. Имя, как правило, отображается в заголовке окна браузера. Данный элемент обязателен для любого HTML-документа и может быть указан не более одного раза.
    • BASE

    Указывает базовый адрес текущего документа (URL), который станет отправной точкой для расчета относительных адресов внутри документа. Элемент не имеет конечного тега. Обязательно присутствие хотя бы одного из атрибутов.

    Атрибуты:

    HREF – определяет базовый адрес (URL) текущего документа.

    TARGET – определяет имя фрейма, которое будет использоваться в гиперссылках по умолчанию. Это может вам пригодиться, если вы хотите открывать все ссылки документа в другом фрейме.
    • STYLE Используется для вставки в документ таблицы стилей CSS

    Атрибуты:

    TYPE – обязательный атрибут. Определяет MIME-тип вставляемого блока стилей. Как правило, значением этого атрибута является "text/css".

    TITLE – определяет имя создаваемой таблицы стилей. Необходим, если вы собираетесь использовать несколько элементов STYLE в одном документе. В этом случае браузер должен спросить пользователя, какой из предложенных стилей будет применен к документу.
    • LINK Описывает взаимосвязь документа с другими объектами

    Элемент LINK описывает взаимосвязь документа с другими документами на сайте, указывая его место в иерархической структуре сайта. Элемент не имеет конечного тега. В заголовке может содержаться несколько элементов LINK.

    Атрибуты:

    HREF – определяет URL объекта.

    REL – определяет тип взаимосвязи текущего документа с объектом, определенным атрибутом HREF. Возможные значения:

    stylesheet – указывает на файл, содержащий таблицу стилей (CSS) для текущего документа. Браузер загрузит css-файл с указанного в атрибуте HREF адреса и применит его к текущему документу (см. также элемент STYLE)
    home – указывает на заглавную страницу вашего сайта

    toc, contents – указывают на файл, содержащий оглавление данного документа.

    index – указывает на файл, содержащий информацию для индексного поиска по текущему документу.

    glossary – указывает на файл, содержащий перечень терминов, относящихся к текущему документу.

    copyright – указывает на страницу сайта, в которой говорится о его создателях, авторских правах и т.п.

    up, parent – указывает на "родительскую" страницу (документ, стоящий на ступеньку выше в иерархической структуре вашего сайта).

    child – указывает на "дочернюю" страницу (документ, стоящий на ступеньку ниже в иерархической структуре вашего сайта).

    next – указывает на следующую страницу в последовательности документов (напр. следующую страницу электронного каталога, документации или словаря).

    previous – указывает на предыдущую страницу в последовательности документов.

    last, end – указывает на последнюю страницу в последовательности документов.

    first – указывает на первую страницу в последовательности документов.

    help – указывает на страницу с подсказкой (напр. по навигации по вашему сайту).

    TYPE – определяет ссылка скрыта для объекта, указанного в атрибуте HREF.

      Пример:


        Элемент DIV
       
       
       
       


    • META Используется для вставки метаданных

    Элемент МЕТА используется для техописания документа, которое представляет собой метаданные в виде пары "имя-значение". С помощью этого элемента в заголовок документа внедряется дополнительная полезная информация, невидимая для пользователя, но порой просто незаменимая для правильной индексации вашей страницы роботами поисковых серверов. Элемент не имеет конечного тега.

    Атрибуты:

    NAME – определяет имя мета-записи. Существует множество предопределенных имен, некоторые из которых вы можете увидеть в указанном ниже примере.

    HTTP-EQUIV – определяет имя мета-записи. Практически аналогичен атрибуту NAME, но используется лишь в случае необходимости передачи дополнительной информации в HTTP-заголовке.

    CONTENT – присваивает значение мета-записи, определенной в атрибуте NAME (или HTTP-EQUIV).

      Пример:


    ...






    ...

    Фреймы


    Фреймы (frames) используются для разбивки окна браузера на несколько областей, каждая из которых представляет собой отдельный HTML-документ (фрейм). Как правило, фреймы используются для облегчения навигации по сайту, создания навигационного меню. Тем не менее, большинство разработчиков избегают использования фреймов, к чему, поверьте, имеют довольно веские основания. Старайтесь использовать фреймы только тогда, когда это действительно необходимо.




    Элементы для создания фреймов и работы с ними:
    • FRAMESET: Определяет фреймовую (оконную) структуру документа: размеры и расположение фреймов на странице
    • FRAME : Определяет фрейм и его свойства внутри FRAMESET-структуры
    • NOFRAMES: Определяет что показывать, если браузер не поддерживает фреймы

    FRAMESET

    Определяет фреймовую (оконную) структуру документа: размеры и расположение фреймов на странице. Создаётся вместо тела документа (то есть элемент BODY в документе не используется).

    Открывает и закрывает список фреймов, определяемых с помощью элемента FRAME. Между начальным и конечным тегами кроме элементов FRAME и NOFRAMES могут находиться другие элементы FRAMESET. То есть элемент FRAMESET поддерживает вложенные конструкции фреймов.


    Атрибуты:

    ROWS – определяет количество и размеры горизонтальных фреймов (фреймов-строк) в окне браузера. В качестве значения задается список размеров фреймов через запятую. Способы задания размеров:

    • в процентах от высоты рабочей области окна браузера. Например: "30%,30%,40%";
    в виде знака "*" (звездочка), говорящего о том, что фрейм занимает все свободное пространство окна браузера, незанятое другими фреймами с явно указанными размерами. Например, звездочка в записи "25%,25%,*" равносильна 50%;
    в пикселах. Например: "75,*";

    Все три способа можно совмещать. Например, "25%,40,*" разобъет экран на три горизонтальных фрейма, первый из которых будет высотой в четверть окна браузера, второй – в 40 пикселов, а третий займет всю оставшуюся площадь.

    COLS – определяет количество и размеры вертикальных фреймов (фреймов-столбцов) в окне браузера. В качестве значения задается список размеров фреймов через запятую. Размеры задаются так же, как и в предыдущем атрибуте ROWS.

    BORDER – определяет ширину рамок фреймов в пикселах. Данный атрибут действует только в браузерах Netscape;

    FRAMEBORDER – определяет наличие рамок у содержащихся внутри FRAMESET фреймов. Возможные значения:

    Yes – отображать рамки;
    No или 0 – не отображать рамки;

    Браузеры Netscape не поддерживают данный атрибут в полной мере и для глобального определения ширины рамок используют атрибут BORDER.

    FRAMESPACING – определяет расстояние (так называемую "серую область") между фреймами в пикселах. Данный атрибут необходим для создания фреймов без рамок.

    FRAME



    Определяет фрейм и его свойства внутри FRAMESET-структуры.


    Атрибуты:

    SRC – обязательный атрибут. Указывает адрес (URL) HTML-файла, отображаемого в данном фрейме.

    NAME – определяет имя данного фрейма, которое будет в дальнейшем использоваться для ссылки на него из других документов с помощью атрибута TARGET. В качестве значения нужно указать любое имя без пробелов с использованием латинских символов и цифр. Имя не должно начинаться с цифр и специальных символов.

    MARGINWIDTH – определяет ширину (в пикселах) левого и правого полей фрейма. Если атрибут не указан, браузер самостоятельно определит оптимальный размер отступа.

    MARGINHEIGHT – определяет ширину (в пикселах) верхнего и нижнего полей фрейма. Если атрибут не указан, браузер самостоятельно определит оптимальный размер отступа.

    SCROLLING – определяет наличие линеек прокрутки содержимого фрейма. Возможные значения:

    yes – отображать линейки прокрутки.
    no – не отображать линейки прокрутки.
    auto – отображать линейки прокрутки при необходимости (если документ, указанный в атрибуте SRC, не умещается во фрейме).

    NORESIZE – не позволяет изменять размеры фрейма. Данный атрибут является флагом и не требует указания значения.

    FRAMEBORDER – определяет наличие рамок у фрейма. Возможные значения:

    yes – отображать рамки;
    no или 0 – не отображать рамки;

    Браузеры Netscape не поддерживают данный атрибут в полной мере и для глобального определения ширины рамок используют атрибут BORDER элемента FRAMESET.

    NOFRAMES


    (HTML 4.0) – No Frames

    Все, что находится между начальным и конечным тегами данного элемента, будет отображено браузером, если он не поддерживает фреймы. Элемент NOFRAMES не имеет атрибутов и должен находиться внутри элемента FRAMESET.

      Пример:

         


    Ваш браузер не поддерживает фреймы. Обыдно, да?
       
       


    Скрипты


    Скрипты – это включения в HTML не-html кода, дополняющего его возможности. С помощью сприптов вы можете создавать анимированные кнопки меню, осуществлять автоматическое перенаправление на другие документы и т.д. Большинство скриптов пишется на языке " onclick="return false">ссылка скрыта. Теперь вы можете ссылаться на помеченную область простым указанием ее имени после имени документа. Например, линк Раздел1 отправит вас в раздел "part" файла document.php, а линк В конец документа – в раздел "bottom" текущего документа. (см. Пример 1)

    TARGET – определяет окно (фрейм), на которое указывает гипертекстовая ссылка. Этот атрибут используется только совместно с атрибутом HREF. В качестве значения необходимо задать либо имя одного из существующих фреймов, либо одно из следующих зарезевированных имен:

    _self – указывает, что определенный в атрибуте HREF документ должен отображаться в текущем фрейме;
    _parent – указывает, что документ должен отображаться во фрейме-родителе текущего фрейма. Иначе говоря, _parent ссылается на окно, содержащее FRAMESET, включающий текущий фрейм;
    _top – указывает, что документ должен отображаться в окне-родителе всей текущей фреймовой структуры;
    _blank – указывает, что документ должен отображаться в новом окне.


      Пример 1:

         

    Использование атрибута NAME: -->
    История бодибилдинга
    ...
    Спорт глазами современника
    ...
    Вернуться к разделуистории


      Пример 2:

         

    Использование атрибута HREF: -->
    ссылка скрыта
    ссылка скрыта
    ...


      Пример 3:

         

    Создадим ссылку для письма с указанием кучи атрибутов -->

    Отправить приглашение .
    или просто письмо : -->
    авторам.


    Текстовые блоки


    Типичными примерами текстовых блоков являются параграфы, абзацы и главы. Для отделения одной части текста от другой также используются разделительные горизонтальные линии и символы возврата каретки.


    Элементы:

    -  ссылка скрыта Используются для создания заголовков текста

    -  ссылка скрыта Используется для разметки параграфов.

    -  ссылка скрыта Отделяет блок HTML-документа от остальной его части

    -  ссылка скрыта Оформляет текст как почтовый адрес

    -  ссылка скрыта Оформляет текст как цитату

    -  ссылка скрыта Осуществляет перевод строки

    -  ссылка скрыта Вставляет в текст горизонтальную разделительную линию.

    -  ссылка скрыта Включает в документ (моноширинным шрифтом) блок предварительно отформатированного текста

    -  ссылка скрыта Включают в документ (моноширинным шрифтом) блок предварительно отформатированного текста (устаревшие элементы)

    H1,H2,...H6


    (HTML 2.0) – Headers

    Используются для создания заголовков текста. Существует шесть уровней заголовков, различающихся величиной шрифта. С их помощью можно разбивать текст на смысловые уровни – разделы и подразделы.

    Атрибуты:

    ALIGN – определяет способ выравнивания заголовка по горизонтали.
    Возможные значения: left, right, center.

      Пример:

         

    Самый большой заголовок посередине


    Заголовок поменьше


    ...
    Малюююсенький такой заголовочек


    P


    Используется для разметки параграфов.

    Атрибуты:

    ALIGN – определяет способ горизонтального выравнивания параграфа.
    Возможные значения: left, center, right. По умолчанию имеет значение left.

     

    Пример:


    Это центрированный параграф.

    Текст располагается в центре окна браузера

    А это параграф, выровненный по правому краю.


    DIV


    Используется для логического выделения блока HTML-документа. Элемент группировки, как и элемент SPAN. В современном сайтостроении используется как удобный контейнер для объектов страницы, которым легко динамически манипулировать – перемещать, включать/выключать, создавать слои, регулировать отступы и т.п.

    В браузеронезависимой вёрстке обычно используется для выравнивания блока html-кода в окне браузера.

    Находящиеся между начальным и конечным тегами текст или HTML-элементы по умолчанию оформляются как отдельный параграф.

    Атрибуты:

    ALIGN – определяет выравнивание содержимого элемента DIV. Атрибут может принимать значения: left, right, center.

      Пример:

    ...Текст документа...

    ...Текст, таблицы, изображения. Выравнивание по центру.

    ...Текст документа...


    Примечания:

    У атрибута ALIGN есть еще одно значение – justify, поддерживаемое современными браузерами. Оно позволяет выравнивать текст по ширине (одновременно по левому и правому краям документа). Не понимающие justify браузеры будут выравнивать текст по левому краю

    ADDRESS


    Находящийся между начальным и конечным тегами текст оформляется как почтовый адрес. Чаще всего оформление выражается в выделении строки адреса курсивом.

      Пример:

     Пишите по следующему адресу:

        Москва. ул. Академика Королева, 13

        Мурзилке



    Примечание:

    Internet Explorer версии 3.0 неверно интерпретирует конечный тег
, поэтому весь текст, находящийся после адреса, будет отображаться курсивом. Эту ошибку можно легко устранить, поставив после
любой элемент форматирования текста.

 

Пример:

     

    Мой адрес не дом и не улица,

    Мой адрес – Советский Союз.

избавляемся от глюка -->

Нормальный текст
...

BLOCKQUOTE


Оформляет находящийся между начальным и конечным тегами текст как цитату. Используется для длинных цитат (в отличие от элемента CITE). Цитируемый текст отображается отдельным абзацем с увеличенным отступом.

  Пример:

Редакция журнала "Домосед" выражает благодарность
Бухаресту Магарычу Шницелю за замечательное стихотворение:

    Синели красные ромашки,

    Желтели в небе облака,

    Синицы в теплый край летели,

    К истоку двигалась река.

    ...


BR


Данный элемент осуществляет перевод строки, то есть практически аналогичен нажатию Enter в текстовом редакторе. После того, как в браузерах появилась возможность обтекания изображения текстом (cм. атрибут ALIGN элемента IMG), понадобился дополнительный атрибут CLEAR. Элемент не имеет конечного тега.

Атрибуты:

CLEAR – указывает на необходимость завершения обтекания изображения текстом. Может принимать следующие значения :

all – завершить обтекание изображения текстом.
left – завершить обтекание текстом изображения, выровненного по левому краю.
right – завершить обтекание текстом изображения, выровненного по правому краю.


  Пример:

     

Первое предложение
Второе предложение на следующей строке


Примечание:
  • Возьмите себе за правило всегда ставить
    после тега . В противном случае все картинки будут иметь неприятный отступ.
  • Атрибут CLEAR почему-то используется очень редко. А зря.

HR


Вставляет в текст горизонтальную разделительную линию.

Атрибуты:

WIDTH – определяет длину линии в пикселах или процентах от ширины окна браузера.

SIZE – определяет толщину линии в пикселах.

ALIGN – определяет выравнивание горизонтальной линии. Атрибут может принимать следующие значения:

left – выравнивание по левому краю документа.
right – выравнивание по правому краю документа.
center – выравнивание по центру документа (используется по умолчанию).

NOSHADE – определяет способ закраски линии как сплошной. Атрибут является флагом и не требует указания значения. Без данного атрибута линия отображается объемной.

COLOR – определяет цвет линии. Задается либо RGB-значением в шестнадцатиричной системе, либо одним из 16 базовых цветов. Атрибут работает только в Internet Explorer.

  Пример:

Текст, разделенный
сплошной горизонтальной линией.

PRE


Используется для включения в документ уже отформатированного текста. Браузеры воспроизводят содержимое этого элемента с помощью моноширинного шрифта, сохраняя пробелы и символы конца строки.

Пример:

     

Ать!
    Два!
        Три!


Примечание:

Желательно избегать использования символа горизонтальной табуляции внутри PRE, т.к. он может быть неадекватно интерпретирован некоторыми браузерами. Вместо символа табуляции рекомендуется использовать число пробелов, кратное четырем.