Методические указания по лабораторным работам По дисциплине

Вид материала

Содержание

Тип диалогового окна Добавить линию тренда
Тема 3. Предпосылки метода наименьших квадратов
Оценка. Практическая реализация теоретических методов эконометрического моделирования. Время выполнения заданий
Тема 4. Множественная регрессия и корреляция
Оценка. Практическая реализация теоретических методов эконометрического моделирования. Время выполнения заданий
ВЕТА) делаем вывод, что наименьшее влияние на количество посещений в месяц магазинов фирмы имеет х
Оценка. Практическая реализация теоретических методов эконометрического моделирования. Время выполнения заданий
Оценка. Практическая реализация теоретических методов эконометрического моделирования. Время выполнения заданий
Рис. 22 Переименование переменных
В подменю Describe указаны следующие пункты

Подобный материал:

1 2 3 4 5

В диалоговом окне Добавить линию тренда в группе Построение линии тренда выберите параметр необходимого вида уравнения регрессии, например Линейная (рис. 8), а на вкладке Параметры установите флажки Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R²) (рис. 9). Здесь же можно самостоятельно ввести название построенного графика в графу Другое.

Рис. 8 Вкладка ^ Тип диалогового окна Добавить линию тренда

Нажав на кнопку ОК получим результат (рис. 9).

Рис. 9 Вкладка Параметры диалогового окна Линия тренда

Рис. 10 График уравнения регрессии

Уравнение линейной регрессии примет вид: у=76,18+0,9288х.

^ Тема 3. Предпосылки метода наименьших квадратов

Задание. Анализ предпосылок МНК.

Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.

^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.

Время выполнения заданий: 2 часа.

Методические указания

Исследования остатков

предполагают проверку наличия следующих пяти предпосылок МНК:

случайный характер остатков;
нулевая средняя величина остатков, не зависящая от ;
гомоскедастичность – дисперсия каждого отклонения , одинакова для всех значений ;
отсутствие автокорреляции остатков – значения остатков распределены независимо друг от друга;
остатки подчиняются нормальному распределению.

Прежде всего, проверяется случайный характер остатков

. С этой целью сроится график зависимости остатков

от теоретических значений результативного признака (рис. 11). Если на графике получена горизонтальная полоса, то остатки

представляют собой случайные величины и МНК оправдан, теоретические значения

хорошо аппроксимируют фактические значения

Рис. 11 Зависимость случайных остатков

от теоретических значений

.

Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что

. Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных.

Вместе с тем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин

, что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков

от теоретических значений результативного признака

строится график зависимости случайных остатков

от факторов, включенных в регрессию

(рис. 12).

Рис. 12 Зависимость величины остатков от величины фактора

Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений

. Если же график показывает наличие зависимости

, то модель неадекватна.

Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью, например,

- и

-критериев.

Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора

остатки

имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции (рис. 13).


а	б	в

Рис. 13 Примеры гетероскедастичности

На рис. 13 изображено: а – дисперсия остатков растет по мере увеличения

; б – дисперсия остатков достигает максимальной величины при средних значениях переменной

и уменьшается при минимальных и максимальных значениях

; в – максимальная дисперсия остатков при малых значениях

и дисперсия остатков однородна по мере увеличения значений

.

При построении регрессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК – отсутствие автокорреляции остатков, т.е. значения остатков

, распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между

, где

– остатки текущих наблюдений,

– остатки предыдущих наблюдений (например,

), может быть определен как

,

т.е. по обычной формуле линейного коэффициента корреляции. Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности

зависит от

-й точки наблюдения и от распределения значений остатков в других точках наблюдения.

^ Тема 4. Множественная регрессия и корреляция

Задание. Построение множественной регрессии в ППП STATISTICA.

Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.

^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.

Время выполнения заданий: 4 часа.

Методические указания

Рассматривается пример корреляционно-регрессионного анализа многомерных наблюдений на условных данных.

Пусть имеется информация о 20 торговых фирмах по 5-ти показателям (рис.14):

у – количество посещений в месяц (тыс. чел.);

х₁ –расходы на рекламу (тыс. руб.);

х₂ – торговые площади (м²);

х₃ – число потенциальных покупателей (тыс. чел.);

х₄ – число конкурирующих магазинов.

Провести полный корреляционно-регрессионный анализ этой информации.

Рис. 14 Исходная информация для тренировочного примера

Приведем сначала некоторые описательные статистики для рассматриваемой информации (рис. 15).

Рис. 15 Описательные статистики для тренировочного примера

Обратите внимание на соотношение стандартных отклонений (standard deviation) и коэффициентов вариации (coeff. of variation). Если S_x₁= 2,63 существенно меньше, чем S_x₂= 234,1(почти в 100 раз), то V_x₁=49,3% меньше V_x₂=67,7% не на много. Связано это с тем, что исследуемые показатели имеют разные единиц измерения (тыс. чел. и тыс. руб.). В этом случае реальное представление о сравнительной мере рассеяния дает коэффициент вариации. Для одинаковых единиц измерения эти два показателя дают сходную информацию (сравните х₁ и х₃).

Рассчитаем для этих переменных матрицу парных коэффициентов корреляции с указанием для каждого коэффициента корреляции р-величины (рис. 16).

Анализ матрицы парных коэффициентов корреляции показывает, что:

значимыми являются три переменные: х₁, х₃ и х₄ (для них расчетные уровни значимости меньше 0,05);
мультиколлинеарность отсутствует (наибольший коэффициент корреляции между независимыми переменными = 0,61, что меньше 0,8).

Рис. 16 Матрица парных коэффициентов корреляции

Матрица частных коэффициентов корреляции следующая (рис. 17) (столбец х₄ отсутствует, но в силу симметрии его можно заменить строкой х₄):

Как видим, чистая связь между у и х₁ ослабла, а между у и х₃ наоборот усилилась. Теснота других связей существенно не изменилась.

Рис. 17 Матрица частных коэффициентов корреляции

Приведем результат расчета по регрессионному анализу (рис.18).

Рис. 18 Отчет об уравнении регрессии в ППП Statistica

Дисперсионный анализ регрессии показывает, что уравнение регрессии значимо (р-величина статистики Фишера меньше 0,05).

Коэффициенты множественной корреляции (R=0,777) и множественной детерминации (R²=0,604) показывают, что уравнение регрессии довольно точно описывает зависимость y от остальных переменных (на 60,4 % изменение yобусловлено изменением всех других переменных).

Различия в исходном и исправленном коэффициентах множественной детерминации (

=0,5) говорит о том, что в уравнении регрессии есть незначимые переменные. На это же указывают расчетные уровни значимости оценок коэффициентов уравнения регрессии. Среди них только один (при х₄) имеет p-value или p-level меньше 0,05. Поэтому, если судить формально на основе этих показателей, то на количество посещений в месяц магазинов фирмы значимо влияет только число конкурирующих магазинов, хотя пошаговый регрессионный анализ дает иные результаты, о чем речь ниже.

Сравнивая коэффициенты регрессии в натуральном масштабе и стандартизованные (

-коэффициенты), видим, что они несут разную информацию и если мы хотим сделать верные выводы о степени влияния на изучаемый показатель факторных признаков, то судить надо по

-коэффициентам (рис. 18). Судя по

-коэффициентам (столбец ^ ВЕТА) делаем вывод, что наименьшее влияние на количество посещений в месяц магазинов фирмы имеет х₁ – расходы на рекламу, а наибольшее - х₄ – число конкурирующих магазинов. Коэффициенты в натуральном масштабе в данном случае сравнивать нельзя, т. к. единицы их измерения разные.

Проведем теперь пошаговый регрессионный анализ. Его результаты приведены ниже.

Рис. 19 Отчет о пошаговой регрессии после исключения незначимых переменных

Как видим, коэффициент множественной детерминации изменился не значимо (был равен 60,4%, а теперь равен 52,2%). Но уравнение регрессии при этом стало существенно проще: вместо четырех переменных содержит всего две переменные.

Кроме того, вместо одной значимой переменной теперь их стало две: х₃и х₄, т. е. окончательно имеем, что на количество посещений магазинов фирмы значимо влияют число потенциальных покупателей и число конкурирующих магазинов и если судить по

-коэффициентам, то в большей мере - число потенциальных покупателей. Разные знаки при этих коэффициентах говорят о разно направленности таких влияний. А поскольку коэффициент парной корреляции между этими показателями равен нулю (p-value для него равна 0,211), т. е. эти переменные независимы, то можем привести их интерпретацию.

Коэффициент при х₃, т. е. b₃ равен 0,747, следовательно, изменение числа потенциальных покупателей на 1 тыс. приведет в среднем к изменению числа посещений магазинов фирмы на 747 человек (уменьшит при уменьшении и увеличит при увеличении). Коэффициент при х₄, т. е. b₄ равен (-0,59), следовательно, изменение числа конкурирующих магазинов на единицу приведет в среднем к изменению числа посещений магазинов фирмы на 590 человек (увеличит при уменьшении и уменьшит при увеличении). При этом надо иметь в виду, что мы сумели описать этим уравнением изменение числа посещений магазинов фирмы только на 52,2%. Остальные 47,8% изменения числа посещений магазинов фирмы зависят от неучтенных в регрессии факторов, в том числе от ошибок наблюдений.

Тема 5. Анализ факторов и резервов роста показателей

Задание. Анализ факторов и резервов роста показателей с помощью пакета STATGRAPHICS.

Исполнение: Выполнение индивидуального задания с использованием Excel. Интерпретация результатов решения.

^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.

Время выполнения заданий: 2 часа.

Тема 6. Нелинейная регрессия

Задание. Нелинейная регрессия в пакете STATGRAPHICS.

Исполнение: Выполнение индивидуального задания с использованием ППП STATGRAPHICS. Интерпретация результатов решения.

^ Оценка. Практическая реализация теоретических методов эконометрического моделирования.

Время выполнения заданий: 4 часа.

Методические указания

Некоторой компанией были собраны следующие данные для осуществления прогноза объема продаж продукции определенной марки (таблица 1). Необходимо провести статистический анализ информации, спрогнозировать реализацию продукции на три последующих полугодия, предполагая, что связь между показателями линейная.

Таблица 1 – Исходные данные для лабораторной работы № 6

полугодие	Объем реализации за 6 месяцев, млн. дол., у	Затраты на рекламы, млн. дол., х₁	Цена за ед. дол. х₂	Индекс потребительских цен, %, х₃	Время х₄
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15	126 137 148 191 274 370 432 445 367 367 321 307 331 345 364	4,0 4,8 7,8 6,3 8,2 9,4 14,0 5,6 9,3 6,7 5,1 4,1 8,6 5,8 5,7	15,0 14,8 15,2 15,5 15,5 16,0 17,0 16,9 15,8 15,8 16,8 16,1 15,4 15,7 16,0	100,0 101,0 103,5 104,3 105,2 106,1 108,9 108,8 107,4 107,2 106,4 104,3 105,9 106,0 106,2	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Для выполнения лабораторной работы используется пакет STATGRAPHICS PLUS.

Двойным щелчком по пиктограмме запустите программу. На экране откроется основное окно (рис. 20)

Рис.20 Основное окно ППП STATGRAPHICS PLUS

Первая строка окна указывает имя файла StatFolio.

Вторая строка – строка меню.

Основные пункты меню:

Пункт меню	Описание
File (файл)	Управление данными, печатью и другими системными опциями
Edit (правка)	Процедуры редактирования
Plot (график)	Построение графиков
Describe (описывать)	Описательные статистики
Compare (сравнивать)	Сравнение данных
Relate (устанавливать)	Простая и множественная регрессия
Special (специальный)	Пункт меню для инициации дополнительных модулей
View (просмотр)	Опции просмотра
Widows (окно)	Опции оконного и графического интерфейса
Help (помощь)	Доступ к справке

Третья строка – панель инструментов, содержит кнопки наиболее часто выполняемых процедур.

Внизу основного окна находятся четыре пиктограммы для вызова электронной таблицы, статистического консультанта, Stat Gallary и окна комментариев.

Для ввода данных в левом нижнем углу основного окна выберите команду (Untitled). Нажмите кнопку (развернуть).

Появится электронная таблица (рис.21), предназначенная для ввода информации.

Рис.21 Электронная таблица в ППП STATGRAPHICS PLUS

Д

ля изменения имени переменной сol1 на Y, необходимо выделить колонку. Щелкнуть правой кнопкой мыши, в появившемся меню выбрать пункт Modify Column (модифицировать колонку) для вызова одноименной панели (рис. 22). Ввести в поле Name (имя) Y, а в поле Comment (комментарий) – реализация, затем нажмите кнопку (ОК).
^

Рис. 22 Переименование переменных

водим исходные данные (рис. 23).

Рис. 23 Исходные данные

Для получения статистических оценок выберем пункт меню Describe, на экране появится подменю (рис. 24)

Р

ис. 24 Подменю Describe

^

В подменю Describe указаны следующие пункты:

числовые данные,
категориальные данные,
проверка гипотез,
определение объема выборки.