Книги по разным темам Pages:     | 1 | 2 | 3 |

Таблица Результаты кластеризации вузов Показатель Все записи Кластер 1 Кластер 2 Кластер % препод. в возрасте до 30 лет 17,015,93 13,884,59 17,895,9 21,574,% препод. в возрасте 30-39 лет 20,774,89 18,533,95 23,075,25 22,224,% препод. в возрасте 40-49 лет 20,715,61 19,764,1 24,67,31 18,23,% препод. в возрасте 50-59 лет 22,624,56 25,274,31 20,74,23 20,052,% препод. в возрасте 60-65 лет 8,733,6 10,173,73 7,483,62 7,572,% препод. в возрасте более 65 лет 10,155,13 12,45,36 6,263,25 10,393,% препод. на 0,5 и 0,25 ставки 13,886,39 11,874,39 14,366,16 16,898,% препод. на полной ставке 86,126,39 88,134,39 85,646,16 83,118,% препод. с ученым званием доцента 34,658,48 39,966,5 29,19,69 31,283,% препод. с ученым званием профессора 8,823,59 9,882,5 6,564,84 9,382,% препод. с ученой степенью кандидата наук 50,99,15 53,545,69 44,8212,44 52,86,% препод. с ученой степенью доктора наук 10,133,84 10,972,58 7,154,83 11,872,% препод. на должности препод. или ассистента 17,397,95 13,656,2 19,117,6 22,088,% препод. на должности ст. препод. 22,727,62 21,396,05 28,867,96 18,465,% препод. на должности доцента 40,728,25 44,966,27 33,487,24 41,047,% препод. на должности профессора 7,533,32 8,293,19 5,763,99 8,11,С помощью алгоритма деревьев решений выполнена классификация субъектов РФ в зависимости от уровня преступности. Признаками, на основе которых производилась классификация, выступали показатели, характеризующие уровень образования безработного населения. Построенное дерево решений позволяет определить иерархию зависимостей уровня преступности в регионах от уровня образования населения. Пример автоматически построенного дерева показан на рис. 3, где жирным шрифтом отмечено среднее число преступлений на 100 000 чел. населения, характерное для данного класса регионов.

Применение алгоритма конструирования ИП для составления рейтинга регионов по множеству показателей, характеризующих качество жизни населения, позволило выявить, какие факторы положительно и отрицательно влияют на итоговое значение ИП. Таким образом, с помощью данного алгоритма можно определить проблемные области в СЭ-развитии территории.

В табл. 2 приведены результаты сравнения разработанной АСМ с некоторыми известными аналитическими системами, которые можно использовать в процессе KDD (знаком л+ отмечены функциональные возможности, имеющиеся в соответствующей системе, знаком - - отсутствующие, знаком л+/ - - присутствующие частично).

Сравнение показало, что разработанная система превосходит аналогичные системы по параметрам, являющимся существенными при мониторинге СЭ-сферы региона.

Все регионы 1 Процент безработных с Процент безработных с Процент безработных с основным общим образо- основным общим образо- основным общим образованием < 12,64 ванием 12,64 и < 15,2 ванием 15,1 597 1 893 2 Процент безработных с Процент безработных с начальным профессиональ- начальным профессиональным образованием < 17,76 ным образованием 17,1 287 1 Рис. 3. Дерево решений, классифицирующее регионы по уровню преступности Таблица Сравнение разработанной АСМ с другими системами KDD ПодВозмож- держка Стан- Нагляд- ОтоТранс- Под- СтатиАналитиче- ность архи- дартные Пост- ность бражеОчистка форма- держка стическая систе- подклю- тектуры алго- роение резуль- ние данных ция OLAP и ские ма чения к кли- ритмы ИП татов данных данных МБД методы БД ент - ИАД ИАД на карте сервер КЛ, ДР, Р, SPSS 13.0 +/ - + + - + + - +/ - - ФА, ВР Microsoft Business ДР, АП, Intelligence +/ - +/ - + + + - НС, КЛ, Б, - + - Developmen Р, ВР, КП t Studio ФА, ВР, Р, Deductor + +/ - + + + +/ - НС, ДР, - + - 5.АП, КЛ + (генериРазрабо- ДР, АП, рование танная + +/ - + + + - НС, КЛ, Б, + + рекоАСМ Р, ВР, КП мендаций) П р и м е ч а н и е. КЛ - кластеризация, ДР - деревья решений, Р - регрессия, ФА - факторный анализ, ВР - временные ряды, АП - ассоциативные правила, НС - нейронные сети, Б - байесовский алгоритм, КП - кластеризация последовательностей.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ 1. Анализ существующих методов мониторинга СЭ-сферы региона позволил выявить присущие им недостатки, для устранения которых предлагается использовать информационно-аналитический комплекс, построенный на базе технологий многомерных баз данных, оперативного и интеллектуального анализа данных, геоинформационных технологий.

2. Впервые предлагается использовать технологию обнаружения знаний в базах данных (KDD) применительно к мониторингу СЭ-сферы региона, что позволит перевести мониторинг на качественно более высокий уровень, а также получить максимальный эффект от применения указанных выше информационных технологий.

3. Проведен анализ существующих систем, используемых при мониторинге и анализе СЭ-информации. Выявлены их недостатки, основным из которых является полное или частичное отсутствие поддержки процесса KDD и методов интеллектуального анализа данных, что делает невозможным выявление глубинных закономерностей, присущих исследуемым СЭ-системам. В связи с этим сделан вывод о необходимости разработки системы мониторинга СЭ-сферы региона на основе технологий KDD.

4. Предложен новый алгоритм Data Mining, позволяющий конструировать интегральные показатели, которые можно использовать для выявления латентных признаков, присущих СЭ-системам, ранжирования объектов, их сравнения, выявления признаков, обусловливающих социальное или экономическое развитие отдельных регионов, и др.

5. Предложена структура автоматизированной системы мониторинга, разработано ее программное и информационное обеспечение, реализующее все функции процесса KDD: ввод данных, их очистку, консолидацию в многомерную базу данных, интеллектуальный анализ данных, вывод и интерпретацию результатов.

6. Разработана методика проведения мониторинга СЭ-сферы региона на базе технологий KDD, в том числе методика анализа СЭинформации с использованием алгоритмов интеллектуального анализа данных. Проведено практическое исследование распространенных методов Data Mining (кластеризация, деревья решений, ассоциативные правила, байесовский алгоритм, нейронные сети и др.) применительно к СЭ-данным, подтвердившее возможность их использования для выявления неочевидных закономерностей, присущих СЭсфере региона.

7. Экспериментальные исследования показали, что применение разработанной системы дает возможность учесть при анализе большие группы СЭ-показателей в их системном единстве, повысить оперативность анализа, выявить неочевидные закономерности в данных.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикация в издании, рекомендованном ВАК 1. Разработка методов информационно-аналитического обеспечения процесса подготовки и переподготовки государственных и муниципальных служащих в области информационных технологий с учетом социально-экономической специфики региона / А. А. Гудков, А. М. Бершадский, А. С. Бождай, Н. В. Осипова // Открытое образование. - 2008. - № 1. - С. 23Ц33.

Прочие публикации 2. Гудков, А. А. Автоматизированный анализ данных с использованием технологий OLAP и Data Mining / А. А.Гудков, П. А. Гудков // Технологии Microsoft в теории и практике программирования :

материалы конф. / под ред. проф. Р. Г. Стронгина. - Н. Новгород :

Изд-во Нижегород. гос. ун-та, 2006. - С. 85Ц87.

3. Гудков, А. А. Исследование возможностей SQL Server 2005 для анализа образовательных данных / А. А. Гудков // Университетское образование: сб. ст. X Междунар. науч.-метод. конф. - Пенза: ПГУ ПДЗ, 2006. - С. 363Ц365.

4. Гудков, А. А. Применение методов Data Mining для анализа социально-экономических статистических данных / А. А. Гудков, А. М. Бершадский, А. Г. Финогеев // Развитие университетского комплекса как фактор повышения инновационного и образовательного потенциала региона : материалы Всерос. науч.-практ. конф. Секция 11.

Методологические проблемы развития статистической науки. - Оренбург : ИПК ГОУ ОГУ, 2007. - С. 16Ц22.

5. Гудков, А. А. Применение новых информационных технологий анализа информации в сфере образования / А. А. Гудков // Известия Пензенского государственного педагогического университета. Сектор молодых ученых. - Пенза : ПГПУ, 2007. - № 3 (7). - С. 201Ц203.

6. Гудков, А. А. Построение интегральных индикаторов как инструмент мониторинга университетского образования / А. А. Гудков // Университетское образование : сб. ст. XI Междунар. науч.метод. конф. - Пенза, 2007. - С. 175Ц177.

7. Гудков, А. А. Анализ социально-экономической сферы региона с использованием технологий Knowledge Discovery in Databases / А. А. Гудков, А. М. Бершадский // Информационные технологии в науке, социологии, экономике и бизнесе IT+SEТ07 : материалы XXXIV Междунар. конф. Майская сессия. - Украина, Крым, ЯлтаЦГурзуф, 2007. - С. 94Ц95.

8. Гудков, А. А. Применение методов Data Mining для анализа данных образовательной статистики / А. А. Гудков, А. М. Бершадский // ТелематикаТ2007 : тр. XIV Всерос. науч.-метод. конф. - СПб., 2007. - С. 382Ц384.

9. Гудков, А. А. Мониторинг региональной системы образования с использованием информационных технологий / А. А. Гудков, А. М. Бершадский, П. А. Гудков // Информационные технологии в образовании, науке и производстве : сб. тр. I Всерос. науч.-практ.

конф. - Серпухов, 2007. - С. 104Ц107.

10. Гудков, А. А. Построение социально-экономических моделей с использованием методов Data Mining / А. А. Гудков // Аналитические и численные методы моделирования естественнонаучных и социальных проблем : сб. тр. II Междунар. конф. - Пенза, 2007. - С. 156Ц158.

11. Гудков, А. А. Выявление закономерностей между уровнем образования населения и социально-экономическими показателями региона с использованием технологий KDD / А. А. Гудков, А. М. Бершадский // Дистанционное и виртуальное обучение. - 2008. - № 5. - С. 29Ц40.

12. Гудков, А. А. Структура автоматизированной системы мониторинга на основе технологий KDD / А. А. Гудков // Новые информационные технологии в научных исследованиях и образовании :

материалы XIII Всерос. науч.-техн. конф. студентов. Часть 1. - Рязань, 2008. - С. 10Ц12.

13. Гудков, А. А. Система поддержки принятия решений на основе технологий KDD в управлении образованием / А. А. Гудков // Университетское образование : сб. ст. XII Междунар. науч.-метод.

конф. - Пенза, 2008. - С. 297Ц299.

14. Гудков, А. А. Технология анализа индикаторов деятельности высших учебных заведений / А. А. Гудков, А. М. Бершадский // ТелематикаТ2008 : тр. XV Всерос. науч.-метод. конф. - СПб., 2008. - С. 442Ц443.

15. Гудков, А. А. Использование нейронных сетей для анализа социально-экономических данных / А. А. Гудков // Перспективные технологии искусственного интеллекта : сб. тр. науч.-практ. конф. - Пенза: Инф.-издат. центр Пенз. гос. ун-та, 2008. - С. 120Ц123.

16. Гудков, А. А. Изучение методологии интеллектуального анализа данных - необходимое условие подготовки квалифицированных управленцев / А. А. Гудков, А. М. Бершадский, И. П. Бурукина // Перспективные технологии искусственного интеллекта : сб. тр. науч.-практ. конф. - Пенза: Инф.-издат. центр Пенз. гос. ун-та, 2008. - С. 52Ц55.

Гудков Алексей Анатольевич Автоматизированная система мониторинга социально-экономической сферы региона на основе технологий обнаружения знаний в базах данных Специальность 05.13.10 - Управление в социальных и экономических системах (технические науки) Редактор Т. Н. Судовчихина Технический редактор Н. А. Вьялкова Корректор Н. А. Сидельникова Компьютерная верстка М. Б. Жучковой ИД № 06494 от 26.12.Сдано в производство 06.11.2008. Формат 60x841/16.

Бумага офсетная. Печать офсетная. Усл. печ. л. 1,16.

Заказ № 624. Тираж 100.

_ Издательство Пензенского государственного университета.

440026, Пенза, Красная, 40.

Pages:     | 1 | 2 | 3 |    Книги по разным темам