Методические указания по лабораторным работам По дисциплине
Вид материала | Методические указания |
- Методические указания по лабораторным работам Факультет: электроэнергетический, 554.73kb.
- Методические указания к лабораторным работам по дисциплине «Материаловедение и ткм», 215.09kb.
- Методические указания к лабораторным работам по курсу, 438.32kb.
- Методические указания по лабораторным работам По дисциплине, 803.46kb.
- Методические указания к электронным лабораторным работам по курсу физической химии, 2388.82kb.
- Методические указания к лабораторным работам по дисциплине «безопасность жизнедеятельности», 867.39kb.
- Методические указания к лабораторным работам №1-5 для студентов специальности 210100, 363.6kb.
- Методические указания к лабораторным работам для студентов специальности 210100 "Автоматика, 536.56kb.
- Методические указания к лабораторным работам Самара 2007, 863.04kb.
- Методические указания к лабораторным работам по физике по практикуму «Вычислительная, 138.12kb.
В диалоговом окне Добавить линию тренда в группе Построение линии тренда выберите параметр необходимого вида уравнения регрессии, например Линейная (рис. 8), а на вкладке Параметры установите флажки Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R2) (рис. 9). Здесь же можно самостоятельно ввести название построенного графика в графу Другое.

Рис. 8 Вкладка ^ Тип диалогового окна Добавить линию тренда
Нажав на кнопку ОК получим результат (рис. 9).

Рис. 9 Вкладка Параметры диалогового окна Линия тренда

Рис. 10 График уравнения регрессии
Уравнение линейной регрессии примет вид: у=76,18+0,9288х.
^ Тема 3. Предпосылки метода наименьших квадратов
Задание. Анализ предпосылок МНК.
Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.
^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.
Время выполнения заданий: 2 часа.
Методические указания
Исследования остатков

- случайный характер остатков;
- нулевая средняя величина остатков, не зависящая от
;
- гомоскедастичность – дисперсия каждого отклонения
, одинакова для всех значений
;
- отсутствие автокорреляции остатков – значения остатков
распределены независимо друг от друга;
- остатки подчиняются нормальному распределению.
Прежде всего, проверяется случайный характер остатков






Рис. 11 Зависимость случайных остатков


Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что

Вместе с тем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин






Рис. 12 Зависимость величины остатков от величины фактора

Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений



Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью, например,


Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.
В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора


![]() | ![]() | ![]() |
а | б | в |
Рис. 13 Примеры гетероскедастичности
На рис. 13 изображено: а – дисперсия остатков растет по мере увеличения





При построении регрессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК – отсутствие автокорреляции остатков, т.е. значения остатков







т.е. по обычной формуле линейного коэффициента корреляции. Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности


^ Тема 4. Множественная регрессия и корреляция
Задание. Построение множественной регрессии в ППП STATISTICA.
Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.
^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.
Время выполнения заданий: 4 часа.
Методические указания
Рассматривается пример корреляционно-регрессионного анализа многомерных наблюдений на условных данных.
Пусть имеется информация о 20 торговых фирмах по 5-ти показателям (рис.14):
у – количество посещений в месяц (тыс. чел.);
х1 –расходы на рекламу (тыс. руб.);
х2 – торговые площади (м2);
х3 – число потенциальных покупателей (тыс. чел.);
х4 – число конкурирующих магазинов.
Провести полный корреляционно-регрессионный анализ этой информации.

Рис. 14 Исходная информация для тренировочного примера
Приведем сначала некоторые описательные статистики для рассматриваемой информации (рис. 15).


Рис. 15 Описательные статистики для тренировочного примера
Обратите внимание на соотношение стандартных отклонений (standard deviation) и коэффициентов вариации (coeff. of variation). Если Sx1= 2,63 существенно меньше, чем Sx2= 234,1(почти в 100 раз), то Vx1=49,3% меньше Vx2=67,7% не на много. Связано это с тем, что исследуемые показатели имеют разные единиц измерения (тыс. чел. и тыс. руб.). В этом случае реальное представление о сравнительной мере рассеяния дает коэффициент вариации. Для одинаковых единиц измерения эти два показателя дают сходную информацию (сравните х1 и х3).
Рассчитаем для этих переменных матрицу парных коэффициентов корреляции с указанием для каждого коэффициента корреляции р-величины (рис. 16).
Анализ матрицы парных коэффициентов корреляции показывает, что:
- значимыми являются три переменные: х1, х3 и х4 (для них расчетные уровни значимости меньше 0,05);
- мультиколлинеарность отсутствует (наибольший коэффициент корреляции между независимыми переменными
= 0,61, что меньше 0,8).

Рис. 16 Матрица парных коэффициентов корреляции
Матрица частных коэффициентов корреляции следующая (рис. 17) (столбец х4 отсутствует, но в силу симметрии его можно заменить строкой х4):
Как видим, чистая связь между у и х1 ослабла, а между у и х3 наоборот усилилась. Теснота других связей существенно не изменилась.

Рис. 17 Матрица частных коэффициентов корреляции
Приведем результат расчета по регрессионному анализу (рис.18).

Рис. 18 Отчет об уравнении регрессии в ППП Statistica
Дисперсионный анализ регрессии показывает, что уравнение регрессии значимо (р-величина статистики Фишера меньше 0,05).
Коэффициенты множественной корреляции (R=0,777) и множественной детерминации (R2=0,604) показывают, что уравнение регрессии довольно точно описывает зависимость y от остальных переменных (на 60,4 % изменение y обусловлено изменением всех других переменных).
Различия в исходном и исправленном коэффициентах множественной детерминации (

Сравнивая коэффициенты регрессии в натуральном масштабе и стандартизованные (



Проведем теперь пошаговый регрессионный анализ. Его результаты приведены ниже.

Рис. 19 Отчет о пошаговой регрессии после исключения незначимых переменных
Как видим, коэффициент множественной детерминации изменился не значимо (был равен 60,4%, а теперь равен 52,2%). Но уравнение регрессии при этом стало существенно проще: вместо четырех переменных содержит всего две переменные.
Кроме того, вместо одной значимой переменной теперь их стало две: х3 и х4, т. е. окончательно имеем, что на количество посещений магазинов фирмы значимо влияют число потенциальных покупателей и число конкурирующих магазинов и если судить по

Коэффициент при х3, т. е. b3 равен 0,747, следовательно, изменение числа потенциальных покупателей на 1 тыс. приведет в среднем к изменению числа посещений магазинов фирмы на 747 человек (уменьшит при уменьшении и увеличит при увеличении). Коэффициент при х4, т. е. b4 равен (-0,59), следовательно, изменение числа конкурирующих магазинов на единицу приведет в среднем к изменению числа посещений магазинов фирмы на 590 человек (увеличит при уменьшении и уменьшит при увеличении). При этом надо иметь в виду, что мы сумели описать этим уравнением изменение числа посещений магазинов фирмы только на 52,2%. Остальные 47,8% изменения числа посещений магазинов фирмы зависят от неучтенных в регрессии факторов, в том числе от ошибок наблюдений.
Тема 5. Анализ факторов и резервов роста показателей
Задание. Анализ факторов и резервов роста показателей с помощью пакета STATGRAPHICS.
Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.
^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.
Время выполнения заданий: 2 часа.
Тема 6. Нелинейная регрессия
Задание. Нелинейная регрессия в пакете STATGRAPHICS.
Исполнение: Выполнение индивидуального задания с использованием ППП STATGRAPHICS. Интерпретация результатов решения.
^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.
Время выполнения заданий: 4 часа.
Методические указания
Некоторой компанией были собраны следующие данные для осуществления прогноза объема продаж продукции определенной марки (таблица 1). Необходимо провести статистический анализ информации, спрогнозировать реализацию продукции на три последующих полугодия, предполагая, что связь между показателями линейная.
Таблица 1 – Исходные данные для лабораторной работы № 6
полугодие | Объем реализации за 6 месяцев, млн. дол., у | Затраты на рекламы, млн. дол., х1 | Цена за ед. дол. х2 | Индекс потребительских цен, %, х3 | Время х4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | 126 137 148 191 274 370 432 445 367 367 321 307 331 345 364 | 4,0 4,8 7,8 6,3 8,2 9,4 14,0 5,6 9,3 6,7 5,1 4,1 8,6 5,8 5,7 | 15,0 14,8 15,2 15,5 15,5 16,0 17,0 16,9 15,8 15,8 16,8 16,1 15,4 15,7 16,0 | 100,0 101,0 103,5 104,3 105,2 106,1 108,9 108,8 107,4 107,2 106,4 104,3 105,9 106,0 106,2 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
Для выполнения лабораторной работы используется пакет STATGRAPHICS PLUS.
Двойным щелчком по пиктограмме запустите программу. На экране откроется основное окно (рис. 20)

Рис.20 Основное окно ППП STATGRAPHICS PLUS
Первая строка окна указывает имя файла StatFolio.
Вторая строка – строка меню.
Основные пункты меню:
Пункт меню | Описание |
File (файл) | Управление данными, печатью и другими системными опциями |
Edit (правка) | Процедуры редактирования |
Plot (график) | Построение графиков |
Describe (описывать) | Описательные статистики |
Compare (сравнивать) | Сравнение данных |
Relate (устанавливать) | Простая и множественная регрессия |
Special (специальный) | Пункт меню для инициации дополнительных модулей |
View (просмотр) | Опции просмотра |
Widows (окно) | Опции оконного и графического интерфейса |
Help (помощь) | Доступ к справке |
Третья строка – панель инструментов, содержит кнопки наиболее часто выполняемых процедур.
Внизу основного окна находятся четыре пиктограммы для вызова электронной таблицы, статистического консультанта, Stat Gallary и окна комментариев.
Для ввода данных в левом нижнем углу основного окна выберите команду (Untitled). Нажмите кнопку (развернуть).
Появится электронная таблица (рис.21), предназначенная для ввода информации.

Рис.21 Электронная таблица в ППП STATGRAPHICS PLUS
Д

ля изменения имени переменной сol1 на Y, необходимо выделить колонку. Щелкнуть правой кнопкой мыши, в появившемся меню выбрать пункт Modify Column (модифицировать колонку) для вызова одноименной панели (рис. 22). Ввести в поле Name (имя) Y, а в поле Comment (комментарий) – реализация, затем нажмите кнопку (ОК).
^
Рис. 22 Переименование переменных
В

водим исходные данные (рис. 23).
Рис. 23 Исходные данные
Для получения статистических оценок выберем пункт меню Describe, на экране появится подменю (рис. 24)
Р

ис. 24 Подменю Describe
^
В подменю Describe указаны следующие пункты:
- числовые данные,
- категориальные данные,
- проверка гипотез,
- определение объема выборки.