Автоматизированная информационная система сбора и анализа статистики посещаемости сайта

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

4 Анализ данных

 

Анализ статистики сайта проводится на основе данных о посетителях сайта, которые собираются и затем записываются в базу данных, для реализации данной задачи используется комбинированный счетчик посещений - внешняя программа плюс картинка.

Принцип работы счетчика посещений заключается в следующем:

В страницы динамического сайта подгружается внешняя программа, которой передаются так называемые переменные окружения. В момент генерации страницы вызывается код внешней программы и полученная из переменных окружения информация записывается в базу данных.

В этих переменных хранится вся базовая информация о текущем посетителе сайта, в том числе:

-IP-адрес посетителя (REMOTE_ADDR);

-Браузер посетителя (HTTP_USER_AGENT);

-Адрес страницы, откуда пришел посетитель (HTTP_REFERER);

-Адрес страницы, куда пришел (REQUEST_URI);

-Параметры вызова страницы (QUERY_STRING).

При просмотре страницы браузером срабатывает java-скрипт, который собирает дополнительную информацию (например, экранное разрешение, глубина цвета и так далее) и вызывает счетчик-картинку, который дописывает дополнительную информацию в базу данных.

Такой способ сбора статистики единственный вариант получить максимально полную информацию обо всех посетителях сайта.

На основании проведенного системного анализа была построена функциональная модель (модель бизнес-процессов) IDEF.0 (Приложение Б), с помощью CASE - средства BPwin.

 

1.5 Исследование информационных потоков

 

В ходе изучения и анализа информационных потоков и алгоритмов переработки данных в системе были рассмотрены следующие данные:

Входные данные:

-данные о местонахождении посетителя - страна, город, регион;

-данные о "предыдущей странице" - реферер, использованные поисковые слова, каталоги и т.д.;

-информация о сессиях - просмотренные страницы, время начала сессии, средняя продолжительность сессии и т.д.;

-информация о компьютере - ip-адрес, браузеры, операционные системы, разрешение экрана и т.д.

Выходные данные:

На выходе получаем отчеты, сгруппированные по категориям.

-Аудитория

-Посещаемость сайта (Сводная статистика)

-Просмотров на хост

-Просмотров на пользователя

-Время просмотра страниц

-Старые/новые пользователи

-Скорость загрузки страниц

-Страницы

-Популярные домены (Варианты обращения)

-Популярные страницы

-Популярные заголовки

-Точки входа

-Точки выхода

-Пути по сайту (Глубина просмотра сайта)

-Внутренние переходы

-Ссылки (Реффереры)

-Ссылающиеся домены

-Ссылающиеся страницы

-Переходы с каталогов

-Переходы с рейтингов

-Переходы с поисковых систем

-История переходов

-Поисковые фразы

-Найденные страницы

-Партнеры

-Отслеживание целей (Рекламные кампании)

-Источники, приведшие к цели

-Фразы, приведшие к цели

-Список достижений целей

-Стоимость рекламы

-Система

-Агенты

-Accept-Languages

-Операционные системы

-Браузеры

-Экранное разрешение

-Глубина цвета

-Использование Cookies

-Использование Java

-Использование JavaScript

-География

-IP адреса

-Языки

-Города

-Страны

-Разное

-Сейчас на сайте

-Индексация сайта

-Роботы

-Администрирование

-Размер базы данных

-Пользователи online

-Журнал посещений

-Локализация

-Конфигурация

-Настройки

-Управление базой данных

-Словари данных

-Отчет по почте

-Права доступа

-Гостевой вход

-Фильтры

-Обновление

-Регистрация

Пояснения по работе с генерируемыми отчетами представлено в "Руководстве пользователя" в приложении Ж.

В результате исследования информационных потоков была построена DFD модель (Приложение В), которая показывает, какие информационные потоки возникают при выполнении функций.

2. Обзор средств разработки

 

2.1 Краткий обзор современных СУБД

 

СУБД Oracle

СУБД Oracle, выпускаемая одноимённой компанией (Oracle Corporation) с 1977 года к настоящему моменту является одной из наиболее часто применяемых СУБД в крупном бизнесе, на транспорте и в научных разработках. Она обладает огромными возможностями, среди которых, например, способность работы с различными типами клиентов - от PDA (Personal Digital Assistant) и других мобильных устройств и до больших промышленных мэйнфреймов. Ранние версии этой СУБД были предназначены только для мэйнфреймов, а в качестве рабочих мест использовались "неинтеллектуальные" терминалы. Однако со временем появились версии Oracle, предназначенные для использования в архитектуре "клиент-сервер" (первой такой версией была Oracle 5, выпущенная в 1985 году). Первоначально эти версии были предназначены для различных серверных платформ - различных версий UNIX, VMS и др. Позже были выпущены версии сервера Oracle для Novell NetWare. Первые версии этого сервера для персональных компьютеров появились в середине 90-х (Personal Oracle 7 for Windows 3.1, Personal Oracle 7 for Windows 95, Personal Oracle Lite, Oracle Workgroup Server 7 for Windows NT). До появления этих версий персональные компьютеры могли использоваться исключительно в качестве клиентских рабочих станций - в состав Oracle для серверных платформ обычно входила клиентская часть для DOS. Высокую популярность этой СУБД обеспечивают высокая производительность, гибкость настроек, а также большое число уже успешно внедренных и эффективн?/p>