Курс научный руководитель Шарапов А. А. Преподаватель Камальдинова З. Ф

Вид материалаРасшифровка

Содержание


Ключевые слова
Экран оценки творческого уровня работы
1 Тип работы
2 Работа является частью НИР руководителя, кафедры, лаборатории
3 Работа относится к новому перспективному направлению развития ИКТ
4 Направлена (подготовлена) публикация в печати
6 Имеется глубокий обзор проблематики по направлению науки и техники в сопоставлении с темой работы
7 Автором предложена собственная формализованная постановка проблемы
8 Получены новые научные результаты
9 Имеются собственные оригинальные идеи автора
11 Освоены новые информационно-коммуникационные технологии
12 Разработаны компьютерные программы, информационные системы и технологии (с учетом полноты и качества реализации понижаются на
13 Проводится многопараметрическое качественное исследование объекта (процесса)
14 Качество оформления работы
15 Качество доклада и ответов на вопросы
Творческий рейтинг КР
Объект исследования
Дискриминантный анализ
Дискриминантный анализ
Рис.1 Геометрическая интерпретация дискриминантной функции и дискриминантных переменных
...
Полное содержание
Подобный материал:
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

ГОУВПО «Самарский государственный архитектурно-строительный университет»

Факультет информационных систем и технологий

Кафедра прикладной математики и вычислительной техники


ПОЯСНИТЕЛЬНАЯ ЗАПИСКА К КУРСОВОЙ РАБОТЕ


по дисциплине

ТЕХНОЛОГИЯ ПРОФЕССИОНАЛЬНОЙ ДЕЯТЕЛЬНОСТИ


на тему


«Дискриминантный анализ как метод прогнозирования оценок по текущей успеваемости»


3 СЕМЕСТР 2 КУРС


Научный руководитель Шарапов А.А.

Преподаватель Камальдинова З. Ф.

Методический руководитель Пиявский С.А.





Выполнила:

студентка ГИП 109 Янюшкина Анна




подпись дата















Оценка преподавателя _______________


Оценка комиссии по результатам защиты_______________


2010 г.

УДК 004.01+311.12


Расшифровка:

Общие вопросы науки и культуры

Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем

Документация


А также:

Демография. Социология. Статистика

Теория статистики. Статистические методы

Статистическая группировка


Ключевые слова

Статистика, статистическое прогнозирование, дискриминантный анализ, дискриминант, прогнозирование оценок.


Реферат

Исследование уникальной системы рейтингов Факультета ИСТ (Информационных Систем и Технологий) Самарского Государственного Архитектурно-Строительного Университета на возможность предсказания оценок в сессию посредством метода дискриминантного анализа. Исследуется учебный рейтинг за третий и четвертый семестры одной из групп студентов, обучающихся в данный момент на факультете, а также результаты сессий этих семестров. Экспериментальным путем выявляется зависимость между рейтингом и оценками одного семестра и проверяется на втором семестре. Всего проведено четыре эксперимента с различными вариантами дискриминантных переменных (показателей рейтинга на тот или иной момент).

Экран оценки творческого уровня работы




Развернутая оценка работы ее автором

Тема работы: Дискриминантный анализ как метод прогнозирования оценок по текущей успеваемости.



Путем метода дискриминантного анализа исследуется зависимость между показателями учебного рейтинга и результатами сессии. В качестве «подопытной» группы была выбрана одна из групп, обучающихся на факультете. В качестве исследуемого материала – третий и четвертый семестры (показатели рейтинга и оценки в сессию). Все студенты были условно разделены на «хороших» и «плохих» по результатам сессии соответствующего семестра. Проведены четыре эксперимента с различными комбинациями условно обозначенных «контрольных точек» (КТ) и показателей рейтинга на момент этих КТ. Полученные результаты, разделяющие две группы, проверены на точность разделения (вычислен процент «проколов» для каждого семестра).

Рейтинг курсовой работы по оценке автора 4















1 Тип работы

1 - носит исследовательский характер, т.е. в работе имеется результат, который был неочевиден до ее выполнения;

Проведены исследования с помощью сложного аппарата дискриминантного анализа. Выявлены зависимости и нюансы.

2 Работа является частью НИР руководителя, кафедры, лаборатории

1 - является частью указанных НИР;

Является частью НИР научной бригады.

3 Работа относится к новому перспективному направлению развития ИКТ

1 - защит кандидатских диссертаций по нему не проводится (например, простые вычислительные и информационные задачи, использование стандартных пакетов программ);

Исследуется метод дискриминантного анализа в применении к рейтингу студента и выявляется возможность предсказания результатов сессии.

4 Направлена (подготовлена) публикация в печати

0 – нет;




5 Работа внедрена или подготовлена к внедрению в сторонних организациях

1 - работа может быть использована в учебных целях в своем учебном заведении;

Может быть использована в изучении и/или применении статистических прогнозов.

6 Имеется глубокий обзор проблематики по направлению науки и техники в сопоставлении с темой работы

1 – знает историю развития направления, его перспективы, ученых и назавания их работ;

Ознакомлена со сферой применения дискриминантного анализа.

7 Автором предложена собственная формализованная постановка проблемы

3 - предложена постановка, использующая достаточно сложный математический аппарат, выполнена, в основном, научным руководителем;

Использован сложный математический аппарат дискриминантного анализа.

8 Получены новые научные результаты

3 – получены, в основном, учащимся, не очень значительны;

Выявлены зависимости между текущей успеваемостью и результатами сессии, а также связанные с этим нюансы.

9 Имеются собственные оригинальные идеи автора

0 - оригинальные идеи отсутствуют;




10 Имеется анализ литературы (по авторам и времени) по теме работы

3 - анализ проведен самим учащимся по нескольким Интернет-источникам с перекрестным сопоставлением информации;

Вся информация о дискриминантном анализе и его применении взята из Интернета. Источники указаны в библиографическом списке.

11 Освоены новые информационно-коммуникационные технологии

1 - освоены достаточно простые методы, основанные на стандартных приложениях типа MS Office, AutoCAD, MathCAD и т.п.;

Работа выполнена в основном в MS Office Excel и Word).

12 Разработаны компьютерные программы, информационные системы и технологии (с учетом полноты и качества реализации понижаются на 1-2 ступени)

0 – нет;




13 Проводится многопараметрическое качественное исследование объекта (процесса)

2 - стандартными средствами (например, Excel), но на большом материале и приводит к существенным выводам;

Математический аппарат реализован в Excel, но хорошо выявляет зависимость.

14 Качество оформления работы

2 - работа (реферат с презентацией, программным продуктом и сайтом) оформлена с формальной точки зрения безупречно;




15 Качество доклада и ответов на вопросы

3 - докладывает самостоятельно, четко, громко, отвечает на все вопросы;




Творческий рейтинг КР






УДК 004.01+311.12

«Дискриминантный анализ как метод прогнозирования оценок по текущей успеваемости»

А.А.Янюшкина

Уникальная рейтинговая система, введенная на Факультете ИСТ (Информационных Систем и Технологий) Самарского Государственного Архитектурно-Строительного Университета и используемая для определения уровня успеваемости студентов, в данной работе исследуется на возможность предсказания результатов сессии по показаниям рейтинга в те или иные фиксированные моменты времени за семестр – «контрольные точки». В качестве математического аппарата был выбран метод дискриминантного анализа.

Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Признаки, которые используются для того, чтобы отличать один класс (подмножество) от другого, называются дискриминантными переменными. Дискриминантный анализ - это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий - дискриминации и методы классификации наблюдений по группам. При интерпретации нужно ответить на вопрос: возможно ли, используя данный набор переменных, отличить одну группу от другой, насколько хорошо эти переменные помогают провести дискриминацию и какие из них наиболее информативны?

Источником материала (динамики рейтинга за третий и четвертый семестры с результатами сессий) для исследования стала одна из групп, обучающихся на факультете. По результатам сессий соответствующих семестров, студенты были условно разделены на «плохих» и «хороших». После чего были проведены три эксперимента с тремя различными комбинациями контрольных точек в качестве дискриминантных переменных. В ходе экспериментов были получены коэффициенты и константы дискриминации, разделяющие два множества («плохие» и «хорошие»). Затем проведена проверка точности разделения прямо и «перекрестно» (контрольный семестр становился исследуемым на дискриминант, а исследуемый на дискриминант – контрольным) с ведением «журнала проколов». Четвертым экспериментом стало усреднение коэффициентов за осень и усреднение за весну. После чего они были применены к дискриминантным переменным (комбинациям контрольных точек) из первых трех экспериментов и проведена проверка точности «попадания» (также прямо и «перекрестно»). Результаты всех четырех экспериментов занесены в сводную таблицу, где указаны коэффициенты и константы каждого случая и общий процент точных «опаданий» в каждом семестре.

Объект исследования

Факультет ИСТ (Информационных Систем и Технологий) Самарского Государственного Архитектурно-Строительного Университета славится уникальной системой рейтингов. Рейтинги включают в себя учебную успеваемость студента (посещаемость и оценки на высший балл), а также успехи внеучебного характера (соревнования, конкурсы, общественную активность). Объектом данного исследования является конкретно первая составляющая рейтинга.

Возник вопрос: насколько показатели рейтинга отражают будущие результаты сессии студента и можно ли предсказать эти результаты?

В качестве математического аппарата для исследования зависимости между рейтингом и результатами сессии был взят аппарат дискриминантного анализа.

Дискриминантный анализ

Аппарат дискриминантного анализа разрабатывался многими учеными-специалистами, начиная с конца 50-х годов ХХ в. Дискриминантным анализом, как и другими методами многомерной статистики, занимались П.Ч. Махаланобис, Р. Фишер, Г.Хотеллинг и другие видные ученые.

Методы дискриминантного анализа находят применение в различных областях: медицине, социологии, психологии, экономике и т.д.

Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Признаки, которые используются для того, чтобы отличать один класс (подмножество) от другого, называются дискриминантными переменными.

Дискриминантный анализ - это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий - дискриминации и методы классификации наблюдений по группам. При интерпретации нужно ответить на вопрос: возможно ли, используя данный набор переменных, отличить одну группу от другой, насколько хорошо эти переменные помогают провести дискриминацию и какие из них наиболее информативны?

Чтобы смысл всего вышесказанного был более понятен, обратимся к геометрической интерпретации дискриминантного анализа.

На рис. 1 изображены объекты, принадлежащие двум различным множествам М1 и М2. Каждый объект характеризуется в данном случае двумя переменными  и .



Рис.1 Геометрическая интерпретация дискриминантной функции и дискриминантных переменных

Если рассматривать проекции объектов (точек) на каждую ось, то эти множества пересекаются, т.е. по каждой переменной отдельно некоторые объекты обоих множеств имеют сходные характеристики. Чтобы наилучшим образом разделить два рассматриваемых множества, нужно построить соответствующую линейную комбинацию переменных  и . Для двумерного пространства эта задача сводится к определению новой системы координат. Причем новые оси L и С должны быть расположены таким образом, чтобы проекции объектов, принадлежащих разным множествам на ось L, были максимально разделены. Ось С перпендикулярна оси L и разделяет два «облака» точек наилучшим образом. При этом вероятность ошибки классификации должна быть минимальной. Сформулированные условия должны быть учтены при определении коэффициентов  и  следующей функции:

F(x) = + (1)

Функция F(x) называется канонической дискриминантной функцией, а величины  и  - дискриминантными переменными.

Конечной формулой для нахождения коэффициентов  и  является:

(2)

По формуле (3) вычисляется константа дискриминации, которая и является главным «разделителем»:

(3),

где и - функции, проходящие через центры двух разделяемых «облаков» (рис.2).



Рис.2 Центры разделяемых множеств и константа дискриминации

Исследование

Для разделения студентов «подопытной» группы на две выборки были использованы результаты сессии каждого из рассматриваемых семестров. В результате чего получились два множества: М1 – «хорошие» студенты и М2 – «плохие», в зависимости от того, выше или ниже среднего балла по группе был их собственный средний балл.

В качестве переменных  и  были взяты показатели учебного рейтинга на двух условно названных «контрольных точках» (в дальнейшем КТ).

В первом эксперименте использовались показатели первой и второй КТ (рис.3). Во втором эксперименте были взяты средние показатели первых четырех КТ и вторых четырех. В третьем – показатели первой и восьмой (в 3 семестре – последней) КТ.



Рис.3 Учебный рейтинг «плохих» и «хороших» студентов на 1 и 2 КТ (3 семестр - осень)

По итогам трех экспериментов были получены шесть матриц коэффициентов (три матрицы – «осенних», три – «весенних») и соответственно 6 констант дискриминации.



Рис.4 Проверка точности разделения на «плохих» и «хороших» (3 семестр, «осенние» коэффициенты)

Была проведена прямая и «перекрестная» (осень-осень (рис.4), осень-весна, весна-весна и весна-осень) проверки коэффициентов на исходных данных относительно констант дискриминации: соответствует ли результат первичному делению на «хороших» и «плохих».

Результаты проверок заносились в так называемый «журнал проколов», где отмечался процент «попадания» (верно предсказанных результатов).



Рис.5 Процент «проколов» в первом эксперименте (ИД – осень, Контроль – весна)

Четвертый эксперимент состоял в усреднении коэффициентов, полученных в первых трех экспериментах.



Рис.6 Средние коэффициенты по осени и по весне

Получившиеся матрицы средних коэффициентов по осени и по весне были применены к дискриминантным переменным (показателям КТ) первых трех экспериментов (также прямо и «перекрестно») и проверены на правильность разделения (дискриминации) двух множеств.



Рис.7 Сводная таблица результатов исследования

Результаты всех четырех экспериментов представлены в сводной таблице (рис.4). Из неё видно, что:
  • «Осенние» коэффициенты во всех трех экспериментах имеют процент успешного предсказания равный 84 в случае дискриминации по осени и 76,19 - по весне (контроль).
  • «Весенние» коэффициенты по отношению к весне во всех трех экспериментах разные и варьируются от 71,42 до 80,95. По отношению к осени (контроль) процент более высок и равен 88 - в первых двух экспериментах и 84 - в последнем.
  • В случае средних «осенних» коэффициентов процент «попадания» по отношению к осени в первом случае понизился до 80, во вторых двух – повысился до 88. По отношению к весне (контроль) в первых двух случаях процент остался таким же, а в последнем – повысился до 80,95.
  • Средние коэффициенты весны в среднем повысили процент «попадания» по весне, но во всех трех случаях понизили процент по отношению к осени (контроль).

Выводы

Полученные в ходе четырех экспериментов данные ещё не достаточно точны для их практического применения - слишком велик процент «проколов». Чтобы достичь более точных результатов, необходимо провести ещё немало экспериментов. В частности таких, как:
  • исследование более, чем двух семестров;
  • исследование более, чем одной группы;
  • с различными вариантами разбиения на «хороших» и «плохих» (возможно, разбиение на более, чем два множества);
  • с большим количеством дискриминантных переменных (более, чем две КТ).

Библиографический список

  1. Методы дискриминантного анализа - allbest.ru [Электронный ресурс] // Режим доступа: ссылка скрыта.
  2. Основы дискриминантного анализа – Портал магистров ДонНТУ [Электронный ресурс] // Режим доступа: ссылка скрыта.
  3. Дискриминантный анализ – Market-Journal.com [Электронный ресурс] // Режим доступа: ссылка скрыта.
  4. Дискриминантный анализ – ПСИ-ФАКТОР [Электронный ресурс] // Режим доступа: ссылка скрыта.