Структура пошукових систем, показники ефективності пошуку

Информация - Компьютеры, программирование

Другие материалы по предмету Компьютеры, программирование

Природно, що не всі релевантні документи, що містяться в базі даних, потраплять в число вибраних.

Навпаки, якщо ми хочемо збільшити обхват, тобто постаратися вибрати найбільшу кількість релевантних видань із загального їх числа в базі, слід сформулювати запит якнайширше. В цьому випадку у вибірку неминуче потрапить значне число непридатних видань, точність виявиться порівняно малою величиною.

У останньому випадку, збільшення кількості вибраних видань неминуче збільшить час обробки результатів пошуку. Реально, якщо кількість вибраних видань складає сотні значень, то час оцінки їх придатності стає надмірно великим, в результаті користувач стомлюється, увага його розсівається, що неминуче приводить до неточностей і помилок.

Таким чином, атрибутивна вибірка виглядає більш переважно як з погляду ефективності і швидкості вибірки, так і економії дискового простору. Проте для її практичного застосування необхідно знати пошукові атрибути, що можливо далеко не у всіх випадках.

У багатьох випадках слідує зупиниться на проміжному варіанті, коли разом з атрибутами в пошуковому середовищі зберігається набір ключових слів і термінів, кожен з яких пов'язаний з визначеним довкола видань. При включенні нового видання в пошукову структуру з набору ключових слів відбирається декілька, що найбільшою мірою відповідають тематиці і змісту видання. При пошуку інформації користувач також проглядає список ключових слів і відбирає ті з них, які, на його думку, найбільшою мірою відповідають його вимогам.

Крім забезпечення можливості ефективної вибірки потрібного видання, дуже важливе те, як слід організувати зберігання видань, щоб гарантувати тільки санкціонований доступ до цього сховища. Додаткові труднощі на організацію процесу зберігання накладає використання в багатьох виданнях мультимедійних компонентів.

3. Організація пошуку інформації за допомогою тематичних каталогів та пошукових машин

 

Найбільш популярним в усьому світі визнаний тематичний каталог, згідно зі статистикою Alexa Internet и Netcraft, - Yahoo! (

Компанія Yahoo! була заснована аспірантами Стенфордського університету Девідом Філо (англ. David Filo) та Джеррі Янгом (англ. Jerry Yang) в січні 1994 року; стала корпорацією 2 березня 1995 року. Головний офіс компанії знаходиться в місті Саннівейл (англ. Sunnyvale), штат Каліфорнія, США.

Якщо ж ви шукайте інформацію свідомо україномовну, то має сенс використовувати українські каталоги, наприклад, "Сузір'я Інтернет", що містить тільки обрані (найцікавіші) ресурси. Принцип роботи з ними ідентичний тому, який ми розглянули на прикладі з Yahoo!. Для пошуку російськомовної інформації слід відзначити перший російський каталог Russіa on the Net (

Пошукові машини улаштовані трохи інакше. По суті це сервер з величезною базою даних URL-адрес, що автоматично звертається до сторінок WWW по всіх цих адресах, вивчає вміст цих сторінок, формує і прописує ключові слова зі сторінок у свою базу даних (індексує сторінки). Більш того, цей сервер звертається по всім, що зустрічаються на сторінках посиланнями і переходячи до нових сторінок, проробляє з ними теж саме. Тому що майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина в кінцевому результаті теоретично може обійти всі сайти в Інтернет. Одна з популярних пошукових машин AltaVіsta (

Проблема більше полягає в тому, що пошукова машина в результаті вашого запиту генерує гігантський список адрес URL з короткими описами. Варто також відзначити інші російськомовні пошукові машини Апорт (

Читаючи про всі перераховані пошукові служби, по неволі за?/p>