Курсовая работа
Информация - Математика и статистика
Другие материалы по предмету Математика и статистика
ч/нед)
V = (2,7 / 4,08) 100% = 65,6%
R = 12 0 = 12 (ч/нед)
Вывод: среднее время, затраченное на подготовку к семинарским занятиям у студентов на 1 курсе 4,08 ч/нед. Т. к. коэффициент вариации является величиной значительной, то среднее время подготовки является величиной не типичной для данной совокупности студентов. Наиболее распространённым количеством часов на подготовку равно 1,85 ч/нед. Число студентов, занимающихся больше 3,6 ч/нед равно числу студентов, занимающихся подготовкой к занятиям больше 3,6 ч/нед.
Группировка 5
Таблица 6
Сон, ч/суткиЧисло студентов% к итогуFi561266369713262281122339816411091850Итог:50100
X = (5 6 + 6 3 + 7 13 + 8 11 + 9 8 + 10 9) / 50 = 7,78 (ч/сут)
NMe = (n+1) / 2 Me = 8 (ч/сут)
Мо = 7 (ч/сут)
D = (xi x)2 i / I
D = 2,4 ((ч/сут)2)
bx = 1,55 (ч/сут)
V = (1,55 / 7,78) 100% = 19,9%
R = 10 5 = 5 (ч/сут)
Вывод: среднее значение часов сна 7,78 ч/сутки. Т. к. коэффициент вариации является величиной незначительной (19,9%), то такое среднее значение часов сна является типичным для данной совокупности. Наиболее распространённым является количество часов сна 7 ч/сутки. Количество студентов, которые спят больше 8 ч/сутки равно количеству студентов, спящих меньше 8 ч/сут.
Группировка 6
Таблица 7
полЧисло студентов, чел% к итогуFiЖ336630М173450Итог:50100
Вывод: из таблицы видно, что большинство опрошенных студентов женского пола.
Группировка 7
Таблица 8
Нравятся ли занятия на 1 курсеЧисло студентов, чел% к итогуFiДа306030Нет204050Итог:50100
Вывод: из таблицы видно, что большинству студентов данной совокупности нравились занятия на 1 курсе в академии.
Комбинационные группировки.
Таблица 9
сонСредний балл зачёткиВсего33,23,544,24,34,54,64,74,8501020001116600001000203710211220311380111302001119110210200181022001020119Итог:453672837550
Вывод: из таблицы видно, что наиболее крупные элементы расположены близко к побочной диагонали. Следовательно, зависимость между признаками близка к обратной.
Таблица 10
ПосещаемостьСредний балл зачёткиВсего33,23,544,24,34,54,64,74,8[6-10]23001002109[10-14]00231000107[14-18]221121311115[18-22]000231504419Итог:453672837550
Вывод: из таблицы видно, что наибольшие элементы расположены близко к главной диагонали. Следовательно, зависимость между признаками близка к прямой.
Аналитические группировки.
Группировка 1
Таблица 11
Введём обозначения:
- неудовлетворительная подготовка к занятиям [0-3]
- удовлетворительная [3-6]
- хорошая [6-9]
- отличная [9-12]
Подготовка к занятиямЧисло студентов, челСредний балл зачётки за 1 курсНеудовлетворительная213,7Удовлетворительная184,3Хорошая84,4Отличная34,5Всего:50
Вывод: из таблицы видно, что зависимость между фактором и признаком существует.
Группировка 2
Таблица 12
Введём обозначения:
- 1/3 всех занятий [6-12] ч/нед
- половина [12-18] ч/нед
- все занятия [18-22] ч/нед
Посещаемость занятийЧисло студентов, челСредний балл зачётки за 1 курс1/3 всех занятий133,3половина194,0все занятия184,5Всего:50
Вывод: из таблицы видно, что зависимости между признаком-фактором и признаком-результатом явной нет.
Группировка 3
Таблица 13
СамообразованиеЧисло студентов, челСредний балл зачётки за 1 курсПосещали доп. курсы254,2Не посещали доп. курсы254,0
Вывод: не наблюдается явной зависимости между признаком-фактором и признаком результатом.
Лабораторная работа № 2
Тема: Корреляционный анализ, множественная линейная регрессия.
Цель: выбор оптимальной модели многофакторной регрессии на основе анализа различных моделей и расчитан для них коэффициентов множественной детерминации и среднеквадратических ошибок уравнения многофакторной регрессии.
Корреляционная матрица
Таблица 1
01234010,5720,1150,4860,20010,57210,2180,471-0,11220,1150,21810,452-0,04830,4380,4710,4521-0,0734-0,2-0,112-0,048-0,0731
Где х0 средний балл зачётки (результат), х1 посещаемость занятий, х2 самообразование (доп. курсы), х3 подготовка к семинарским занятиям, х4 сон.
Введём обозначения признаков-факторов: 1 посещаемость занятий на 1 курсе (ч/нед); 2 самообразование (ч/нед); 3 подготовка к семинарским и практическим занятиям (ч/нед); 4 сон (ч/сут); 0 средний балл зачётки по итогам экзаменов за 1 курс.
Расчётная таблица для моделей многофакторной регрессии.
Таблица 2
Модель многофакторной регрессииR2E21-2-3-40,390,451-2-30,370,462-3-40,230,511-3-40,380,451-20,330,471-30,360,461-40,350,472-30,200,522-40,050,563-40,220,51
По трём критериям выбираем оптимальную модель.
- число факторов минимально (2)
- max R, R = 0,36
- min E, E = 0,46
Следовательно, оптимальной моделью является модель 1-3. Значит, признаки-факторы посещаемость занятий на 1 курсе и подготовка к семинарским занятиям влияют значительнее других факторов на признак-результат.
Среднеквадратическая ошибка уравнения многофакторной регрессии небольшая по сравнению с ошибками, рассчитанными для других моделей многофакторной регрессии.
Составляю для этой модели уравнение регрессии в естественных масштабах.
Х0/1,3 = a + b1x1 + b3x3
Корреляционная матрица.
Таблица 3
01301,000,570,4810,571,000,4730,430,471,00
t0/1,3 = 1t1 + 3t3
0,57 = 1 + 0,473 0,57 = 1 + 0,47(0,44 0,471) 1 = 0,4
0,44 = 0,471 + 3 3 = 0,44 0,471 3 = 0,25
t0/1,3 = 0,4t1 + 0,25t3
b1 = (0 / x1) 1 = (0,47 / 4,4) 0,4 = 0,071
b3 = (0 / x3) 3 = (0,79 / 2,68) 0,25 = 0,073
a = x0 b1x1 b3x3 = 4,27 0,071 16,13 0,073 4,08 = 2,8
имеем: х0/1,3 =2,8 + 0,071х1 + 0,073х3 уравнение линейной множественной регрессии.
R0/1,3 = 1r01 + 3r03
R0/1,3 = 0,4 0,58 + 0,25 0,48 = 0,6