Аудит / Институциональная экономика / Информационные технологии в экономике / История экономики / Логистика / Макроэкономика / Международная экономика / Микроэкономика / Мировая экономика / Операционный анализ / Оптимизация / Страхование / Управленческий учет / Экономика / Экономика и управление народным хозяйством (по отраслям) / Экономическая теория / Экономический анализ Главная Экономика Информационные технологии в экономике
Бараз В.Р.. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel, 2005 | |
2.4.1. Использование традиционных способов расчета |
|
На первом этапе проведем вычисление традиционным, а потому и самым утомительным способом, т.е. лвручную. Здесь нам в лучшем случае может помочь лишь калькулятор. У ' о vr - / /" о / ' ' I I I I 2 4 6 8 10 12 Время X, - Рис.12. Графическое изображение исследуемой зависимости y = fx) Вычисление коэффициентов регрессии удобнее проводить в табличной форме. Для этого заполним табл.5, в которой, помимо исходных данных (их мы расположим по столбцам), в графах 4-8 укажем вспомогательные расчетные данные. Для проверки правильности вычисления в таблице можно использовать следующее выражение: Цх+у)2 = Их2 + 2!ху + Ну2. 1. Определим среднее арифметическое для каждого ряда - для х и у. Они составят соответственно: х = 59,5/8 = 7,44 - и у = 61,5/8 = 7,69 кг. Значения полученных сумм подставляем в формулу для последующей проверки. Получим: 2072,00 = 541,75 + 2x510,25 + 509,75; 2072,00 = 2072,00. Следовательно, вычисления выполнены правильно. Вспомогательная таблица для расчета коэффициентов регрессии Таблица 5 № п/п х У х2 у2 ху х+у (х + у)2 1 2 3 4 5 6 7 1 1,5 5,0 2,25 25,00 7,50 6,50 42,25 2 4,0 4,5 16,00 20,25 18,00 8,50 72,25 3 5,0 7,0 25,00 49,00 35,00 12,00 144,00 4 7,0 6,5 49,00 42,25 45,50 13,50 182,25 5 8,5 9,5 72,25 90,25 80,75 18,00 324,00 6 10,0 9,0 100,00 81,00 90,00 19,00 361,00 7 11,0 11,0 121,00 121,00 121,00 22,00 484,00 8 12,5 9,0 156,25 81,00 112,50 21,50 462,25 Итого ?=59,5 ?=61,5 ?=541,75 ?=509,75 ?=510,25 ?=121,00 ?=2072,00 2. Рассчитаем теперь коэффициенты b0 и Ь\ по известным формулам: nn n n Xx? X л "X x X x i =1 i =1 i=1 i=1 2 ( n Л n X xi- X x V i=1 i=1 541,75 x 61,50 - 59,50 x 510,25 Д ДД кг. b0 = 2 = 3,73 b0 8 x 541,75 - 59,502 n n n n Z ХгУг -Z X Z У b = Ч ^Чi=1T- n n i=1 1 / Д \2 Z x2 - Z x V i=1 8 x 510,25 - 59,50 x 61,50 = 0 b1 = 8 x 541,75 - 59,502 = 0,53 кг/ч. Следовательно, уравнение регрессии, т.е. формула, с некоторой вероятностью отображающая зависимость у от х, имеет следующий вид: у = 3,73 + 0,53х. 3. Для проверки значимости (пригодности) полученного уравнения регрессии применяют специальные приемы. Такую проверку называют проверкой адекватности модели. Для количественной проверки гипотезы об адекватности можно ис-пользовать так называемый F-критерий (критерий Фишера): ад S2 F = S ' общ Где Sад - остаточная дисперсия, или дисперсия адекватности. Она характеризует величину среднего разброса экспериментальных точек Ду относительно линии регрессии, т.е. Ду = yt - yt (Ду есть ошибка в предсказании экспериментального результата на основании математической модели). Остаточная дисперсия, таким образом, позволяет оценить ошибку, с которой уравнение регрессии предсказывает фактический результат. Следовательно, минимальная величина остаточной дисперсии должна свидетельствовать о более удачном выборе линии регрессии. Вообще в статистике принято считать, что применение критерия минимальности остаточной дисперсии является вполне надежным способом отбора адекватных экономико-математических моделей. Чтобы определить, велика или мала ошибка в предсказании эмпирических результатов, ее нужно сопоставить с некоторой статистической величиной (эталоном), принимаемой в качестве критической. Вот почему используется расчетный F-критерий, который затем сравнивают с Ккрит. Если Fp^ < FJCPHT, то модель признается адекватной, т.е. с заданной степенью достоверности (надежности) она верно предсказывает реальный результат. Если же F^^ > F,^, то вывод обратный: данное уравнение не может с заданной надежностью прогнозировать эмпирические данные. Проверка адекватности модели по критерию Фишера дает возможность ответить на вопрос, во сколько раз хуже по сравнению с опытом предсказывает результат модель. Остаточная дисперсия Sад рассчитывается путем деления остаточной суммы квадратов на число степеней свободы f по следующей формуле: n Еду2 2 _ i=1 S" f ж Здесь число степеней свободы f = n - (k + 1), где n - число опытов в эксперименте (т.е. объем случайной выборки); k - число изучаемых факторов. Для однофакторного эксперимента имеем f = n - 2 и тогда XV Е(у-у)2 S 2 = i=1 = J= ад ^ ^ Х n - 2 n - 2 Вторая характеристика в формуле для расчета F-критерия (знаменатель) - это так называемая усредненная, или общая дисперсия. В качестве таковой принимается квадрат стандартной ошибки S^ . Этот показатель фактически характеризует случайную ошибку для всей выборки, т.е. оценивает несоответствие между конкретными (текущими) значениями результата эксперимента и средним арифметическим. 2 _ i=1 _ i=1 Общая дисперсия рассчитывается так: I (у - У)2 I (у - У)2 S2 = общ f n -1 Х Вернемся к нашему примеру. Оценим статистическую пригодность полученного линейного уравнения. Показатель Sад удобно вычислять в табличной форме (табл.6). Расчет проведем по формулам: IАУ2 8 86 I (У, - У2 S2 = = ^ = 1,11 и ^ = ^ = Ц^- = 4,63. n 8 n 8 Вспомогательная таблица для проверки уравнения на адекватность Таблица 6 № п/п x i У, у,=3,73+0,53х Уi -У, (У, -У)2 У, -Уi (У, -у) 1 2 3 4 5 6 7 8 1 1,5 5,0 4,53 0,47 0,221 2,69 7,24 2 4,0 4,5 5,85 -1,35 1,822 3,19 10,18 3 5,0 7,0 6,36 0,62 0,384 0,69 0,48 4 7,0 6,5 7,44 -0,94 0,884 1,19 1,42 5 8,5 9,5 8,24 1,26 1,588 1,81 3,28 6 10,0 9,0 9,03 -0,03 0,001 1,31 1,72 7 11,0 11,0 9,53 1,44 2,074 3,31 10,96 8 12,5 9,0 10,35 -1,35 1,882 1,31 1,72 ?=59, 5 ?=61, 5 ?=0,12 ?=8,86 ?=15,51 ?=36,30 Определим величину критерия Фишера: ^асч = - = 0,24 р SU 4,63 . Определим табличное значение для а = 0,05, а также степеней свободы для n числителя f1 (Sад) и знаменателя f2 (S^). Они составят соответственно f1 = - 2, т.к. f = n -(к + 1), где n - число опытов в эксперименте (т.е. составляет объем случайной выборки); к - число изучаемых факторов. Для однофактор- ного эксперимента имеем f = n - 2. Для второго показателя f2 = n - m, где m - количество вычисленных констант для переменной у, которая соответствует среднемарифметическому у (т.е. m = 1). Тогдаf = n - 1,а F^ (0,05; f 1; f2) = 3,87 (прил.3). Поскольку 0,24 < 3,87, то с вероятностью 95 % можно утверждать, что рассматриваемое уравнение адекватно и способно с указанной достоверностью предсказывать экспериментальные результаты. Если теперь возвратиться к самому обсуждаемому заданию, то можно заметить, что смышленый студент Боб Деканкин вполне управился с порученным делом. Он сообщил пытливому г-ну Тютякину, что на основании имеющихся опытных данных можно уверенно спрогнозировать (с надежностью 95 %) результат сбора медного лома: за 8 часов работы это составит почти 8 кг (3,7 + 0,53x8 = 7,97). Примечание. В литературе по статистике обычно используются два подхода к оценке Fp^: либо как отношение S ад / S^, либо как S^ / S ад. Со-ответственно и статистический вывод на основании сравнения вычисленного F-критерия и эталонного F^^ дается с учетом принятого соотношения. Нами рассматривается версия, когда F^^ = S ад / S^; в то же время в компьютерной программе используется обратное отношение, т.е. Fpасч - ^общ / S^. Это различие не носит принципиального характера. Важно только помнить, какой при- ем для анализа используется и, следовательно, каким образом дается надлежащее заключение. |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "2.4.1. Использование традиционных способов расчета" |
|
|