Поисковые системы в Интернете

Мы постоянно ищем материалы для выступлений, докладов, выпускных, бакалаврских и магистерских диссертаций и т. д. В сносках вы можете найти, среди прочего, ссылки на веб-сайты, представляющие определенный контент. Однако в работах, претендующих на научную значимость, поражают такие литературные источники (к ним относятся также различные виды студенческих работ),.

Некоторые авторы произведений подходят к использованию контента, найденного на сайтах, достаточно свободно, не опасаясь далеко идущих заимствований. Есть и те, кто вместо интеллектуальной силы использует силу собственных рук, ограничиваясь комбинацией клавиш — «ctrl+a» (выбрать все работы, найденные в Интернете) затем — «ctrl+c» (копировать в кеш компьютера) и наконец — «ctrl+v» (вставить из кеша в текстовый редактор копируемой работы).

Давайте помнить, что современные компьютерные технологии позволяют быстро проверить, является ли наша работа оригинальной..

Интернет – практически неиссякаемый источник информации, мы можем найти в нем вдохновение для собственных мыслей. Поэтому нам не обязательно копировать чужие работы для создания публикации. На сайтах представлены огромные ресурсы ценных знаний, на основе которых мы можем найти, изучить и описать интересующий нас фрагмент социальной реальности. Здесь возникает вопрос, как точно и быстро достичь этого содержания? Если мы решили начать поиск с веб-сайтов, мы обычно вводим адрес в браузере.и в поле «поиск» введите пароль (однословный или сложный запрос) и просмотрите результаты. Самый простой способ — не лучший способ получить хорошие результаты в этом случае. Чтобы добраться до ценных материалов и тех, кто нам небезразличен, мы продираемся сквозь содержание сотен, тысяч страниц и ищем, ищем, ищем… Следуя нескольким простым советам, мы значительно сократим время, затрачиваемое на эти действия.

При использовании поисковой системы Google помните, что:

Неважно, используем ли мы прописные или строчные буквы при вводе условий поиска, поисковая система найдет термин, написанный так — «апс» или вот так — «АПС». Результаты будут такими же;
«Символы пунктуации обычно игнорируются, включая @#$%^&*() =+[]\ и другие специальные символы»;
Меньше слов для описания того, что нам нужно, означает более точные результаты;
«Чем более уникальным является слово, тем больше вероятность того, что оно даст релевантные результаты».

Не нужно никого убеждать, что на сайтах можно найти массу интересных материалов. Исследования с использованием Интернета должны быть сосредоточены на так называемых глубокая сеть или скрытая сеть, также известная как «скрытый интернет», т.е. веб-ресурсы, которые труднодоступны для поисковых систем (по техническим причинам или другим ограничениям).

В 2000 г. был опубликован отчет Майкла Бергмана «Глубокая паутина: обнаружение скрытой ценности» (обновленный в 2009 г.). По его оценкам, размер скрытого Интернета (где общедоступная информация представлена бесплатно) в 400-550 раз превышает размер так называемого мелкий интернет. Глубокая сеть содержит 7500 терабайт информации (которая состоит из почти 550 миллиардов документов разного рода) — по сравнению с 19 терабайтами «обычного» интернета.

Как найти упомянутый выше отчет? Это можно сделать двумя способами:

1. Введите название доклада в поисковик и тогда получим список примерно в 232 тысячи. результатов и на первых страницах мы найдем этот отчет либо только упоминания о нем, либо цитаты.

2. Мы вводим название отчета в поисковую систему Google, но на этот раз мы добавляем расширенный оператор «тип файла: pdf» (потому что мы хотим, чтобы полный файл этого отчета был в формате pdf), то есть: The Deep Web: Surfacing Тип файла скрытого значения: pdf. В итоге мы получим список примерно из 23 тысяч. документов, в которых первые два пункта содержат один и тот же отчет.

Мы можем найти много интересных материалов, используя т.н. предметные шлюзы. Ниже приведены несколько примеров адресов этих ворот:

Десятичная классификация Дьюи была разработана американским библиотекарем Мелвилом Дьюи и опубликована в 1876 году. В настоящее время у нас есть его 22-я версия. Эта классификация основана на десятичной системе, в которой мы имеем 10 делений, которые в свою очередь можно разделить еще на 10 и так далее.

Ниже представлена схема основных отделов:

000 Произведения общего содержания,

100 философия,

200 Религия,

300 социальных наук,

400 языков,

500 естественных наук,

600 прикладных наук,

700 штук,

800 Литература,

900 География и история4.

Приведенная выше классификация важна тем, что при поиске, чтобы не тратить время в специализированных поисковиках, мы используем номера, к которым отнесены отдельные отрасли науки.

Статьи, книги, электронные версии научных журналов, результаты различных исследований, фото-, кино- и аудиодокументация — вот лишь несколько примеров материалов, доступных каждому, кто знает, где и как искать. Эти материалы находятся в открытом доступе бесплатно.

Материалы, найденные на веб-сайтах, могут стать импульсом для ваших собственных исследований. Если мы их проводили, то специализированные программы, поддерживающие этот этап работы исследователя, помогают в количественной обработке результатов. В России Statistica и SPSS являются популярными программами, охватывающими вышеупомянутую область.