Регрессионный анализ в задачах психолого-педагогических исследований
Реферат - Математика и статистика
Другие рефераты по предмету Математика и статистика
? внутригрупповой, т.е. .
Межгрупповая дисперсия характеризует вариацию признака У за счет учтенного фактора, а внутригрупповая дисперсия - за счет неучтенных факторов
(19)
(20)
где - значение признака
- условная средняя признака ;
- общая средняя признака Y;
- частота значений признака Y;
- частота значений признака X;
n - объем выборки (сумма всех частот).
Корреляционное отношение изменяется от 0 до 1, т.е. . Чем ближе к 0, тем слабее связь между результативным признаком У и учтенным фактором Х.
С помощью корреляционного отношения можно оценить тесноту взаимосвязи между признаками и в случае линейной зависимости , т.к. в случае линейной зависимости.
- коэффициент детерминации, показывающий на сколько процентов в среднем вариация результативного признака объясняется за счет вариации учтенного факторного признака.
3. Множественный корреляционно - регрессионный анализ
Корреляционная взаимосвязь между тремя и более признаками (показателями) называется множественной корреляционной зависимостью. Во множественной корреляционной зависимости решаются те же задачи, что и в парной, а именно: оценивается теснота взаимосвязи между признаками (корреляционный анализ), определяется аналитическое выражение этой взаимосвязи приближенно в виде уравнения регрессии (регрессионный анализ). Но во множественном регрессионном анализе предварительно решается еще одна задача - отбор факторных признаков в уравнение регрессии (регрессионная модель). При отборе факторных признаков в регрессионную модель необходимо учитывать следующие условия:
1)в модель вводятся факторные признаки, оказывающие сильное влияние на результативный признак;
2)факторные признаки, вводимые в модель, должны быть линейно независимыми или иметь слабую связь между собой.
Если при анализе успешности обучения подростков рассматривать различные независимые переменные, влияющие, с точки зрения исследователя, на результативный признак, то в этом случае можно построить линейное уравнение множественной регрессии, в которое будут входить все рассматриваемые переменные. В общем случае, зависимость между несколькими переменными величинами выражают уравнением множественной регрессии, которая может быть как линейной, так и не линейной. В простейшем случае множественная линейная регрессия выражается уравнением с двумя независимыми переменными величинами X и Z и имеет следующий вид:
(21)
где a - свободный член, b и c - параметры уравнения (21).
Уравнение (21) может решаться относительно зависимой переменной Z, тогда X и Y являются независимыми переменными, и уравнение множественной регрессии имеет следующий вид
(22)
Можно решить уравнение (21) и относительно X, тогда Z и Y будут независимыми переменными, а уравнение будет иметь следующий вид
(23)
При проведении конкретных расчетов выбор зависимых и независимых переменных определяется планом эксперимента.
Решение уравнений (21), (22), (23) состоит в том, что находятся величины a, b, c на основе решения системы из трех уравнений.
Для решения уравнения (21) система имеет следующий вид
(24)
Для решения уравнения (22) система будет выглядеть следующим образом
(25)
Для решения уравнения (23) система будет иметь следующий вид
(26)
В общем случае уравнение регрессии представляет собой сложный полином, описывающий зависимость сразу между несколькими переменными. Такое уравнение множественной регрессии имеет вид
(27)
Где и т.д. независимые переменные, а Y - зависимая переменная.
II. ИССЛЕДОВАТЕЛЬСКАЯ ЧАСТЬ
1 Линейная регрессия при обработке результатов исследования
Использование метода мы проиллюстрируем на эмпирических данных 2009г. мониторинга качества успеваемости учащихся. Используются несколько классов из ряда городских школ и колледжей. В качестве примера изучим, как связано с успеваемостью учащихся потребление табачных изделий. Цель примера - исследование возможной зависимости между успеваемостью и потреблением табачных изделий.
Может быть, табак употребляют, поскольку материальное положение позволяет? Может быть, их употребление вызывает в целом падение уровня достатка? Такие вопросы также возникли в ходе исследования, но на настоящий момент они нами не изучены, а получены только анкетные данные.
В качестве тестируемых групп нами взяты ответы о успеваемости по нескольким основным предметам, а также сведения о посещении дополнительных занятий. Тестирование мы проводили по модели:
- Модель регрессии: отличаются ли группы различной зависимостью успеваемости от потребления табачных изделий.
Тестирование мы проводили по следующей форме:
1.Пол _________ ________
жен муж
2.Возраст __________________
3.Употребляете ли Вы табачные изделия? _________ ________
да нет
4. Успеваемость по предметам:
а) математика _________________________
б) русский язык и литература_____________
в) физика и химия ______________________
г) казахский язык и литература ___________
д) история ____________________________
е) физическая культура _________________
. Сколько детей в семье? ________________
. Какой возраст родителей:
мама__________
папа__________
. Употребляют ли родители табачные изделия? ________ _______
да нет
8.Посещаете ли вы дополнительные занятия? _______ ________
да нет
9.Если посещаете, ?/p>