Анализ данных в пакете mathcad + cd: Учебное пособие. 1-е изд. Isbn 978-5-8114-1096-5 Год

Вид материалаУчебное пособие
Подобный материал:


Воскобойников Ю. Е.
Регрессионный анализ данных
в пакете MATHCAD + CD:
Учебное пособие. 1-е изд.

ISBN 978-5-8114-1096-5

Год выпуска 2011
Тираж 1500 экз.
Формат 12,8  20 см
Переплет: твердый
Страниц 224


Цена 450,76 руб.

Книга содержит основные теоретические положения по следующим разделам регрессионного анализа экспериментальных данных: регрессионные модели и регрессионное моделирование, парный и множественный регрессионный анализ, построение регрессионных моделей на практике. Приводятся необходимые расчетные соотношения. Большое внимание уделяется реализации этих соотношений в математическом пакете Mathcad. Учебное пособие содержит большое количество примеров и копий фрагментов документов Mathcad, которые позволят читателям не только лучше понять и усвоить учебный материал, но и эффективно использовать пакет Mathcad при выполнении курсовых и дипломных работ, а также при работе над магистерскими и кандидатскими диссертациями.

Файлы, включенные в прилагаемый CD, содержат документы Mathcad, позволяющие построить и проанализировать парные и множественные регрессионные модели. Это, с одной стороны, позволит читателю использовать эти документы для построения «своих» регрессионных моделей с минимальными затратами времени, а с другой стороны, послужит некоторым примером при составлении «своих» программ обработки данных.

Книга рекомендуется студентам технических и экономических специальностей при изучении учебных дисциплин, включающих корреляционный и регрессионный анализ данных. Книга будет также полезна магистрантам, аспирантам, инженерам и научным сотрудникам при построении регрессионных моделей и эмпирических зависимостей по экспериментальным данным с использованием современных математических пакетов.

Введение


Среди методов прикладной математической статистики регрессионный анализ занимает важное положение. Это обусловлено тем, что регрессионный анализ является одним из самых распространенных методов обработки результатов наблюдений для построения математических моделей, которые широко используются при исследованиях процессов в различных системах (технических, экономических, социальных и т. д.).

Объектом рассмотрения регрессионного анализа является некоторый физический (технический, экономический, социальный) процесс, который характеризуется несколькими переменными. Одна из этих переменных (называемая зависимой) функционально связана с другими независимыми переменными. Под независимыми переменными понимаются переменные, для которых можно устанавливать желаемые значения, либо те, которые можно наблюдать, но не управлять. В результате изменения независимых переменных появляется некоторый эффект, который приводит к изменению зависимой переменной (иногда называемой переменной-откликом). В большинстве случаев функциональная связь между этими переменными является неизвестной, и необходимо построить некоторое аналитическое выражение — уравнение регрессии, которое с приемлемой точностью описывала бы зависимость среднего значения зависимой переменной от одной или нескольких независимых переменных.

В данном учебном пособии рассматриваются следующие основные задачи регрессионного анализа экспериментальных данных: отбор значимых независимых переменных; выбор вида уравнения регрессии (линейная, полиномиальная, экспоненциальная и т. д.); вычисление оценок для неизвестных коэффициентов; построение доверительных интервалов для неизвестных коэффициентов; проверка значимости вычисленных оценок и построенного уравнения регрессии; регрессионные модели с фиктивными переменными; робастные алгоритмы оценивания коэффициентов регрессии.

В России и за рубежом издано большое количество литературы, посвященной регрессионному анализу и обработке экспериментальных данных. Основными недостатками этих изданий являются сложность изложения материала и отсутствие алгоритмической реализации тех или иных расчетных соотношений в среде определенного математического пакета, которые сегодня широко используются в научно-инженерных расчетах. Поэтому автор при написании учебного пособия преследовал следующие цели:

1) изложить материал в максимально доступной и понятной форме (оставляя в стороне сложные доказательства, которые можно найти в приводимом списке литературы);

2) при изложении материала придерживаться рецептурной формы, т. е. непосредственно для практического применения излагаемых методов или алгоритмов;

3) показать алгоритмическую и численную реализацию основных расчетных соотношений в математическом пакете Mathcad;

4) проанализировать основные трудности, возникающие при решении задач регрессионного анализа на практике.

Изложение материала сопровождается большим количеством примеров, а также заданий, решение которых служит закреплению теоретических положений изучаемой дисциплины. Эту же цель преследуют контрольные вопросы и учебные задания, приводимые в конце каждой темы пособия.

Предполагается, что читатель знаком с основами работы в пакете Mathcad. При отсутствии таких знаний можно обратиться к учебным пособиям [3, 6] и изучить требуемые конструкции пакета Mathcad. Программирование в пакете Mathcad подробно рассматривается в [3]. Необходимые сведения по теории вероятностей и математической статистике кратко изложены в теме 1 данного пособия, а также в соответствующей учебной литературе (например, [1, 2, 4]).

Значок  в тексте означает описание программного обеспечения, приводимого на прилагаемом компакт-диске.


Воскобойников Ю. Е.

Регрессионный анализ данных

в пакете MATHCAD + CD:

Учебное пособие. 1-е изд.

Оглавление

Введение .......... 3

Тема 1. Выборочные характеристики распределений случайных величин .......... 6


1.1. Необходимые определения и понятия теории вероятностей .......... 6

1.1.1. Случайная величина и законы ее распределения .......... 6

1.1.2. Числовые характеристики случайных величин .......... 8

1.1.3. Нормально распределенная случайная величина .......... 9

1.1.4. Двумерная случайная величина и ее характеристики .......... 12

1.1.5. Векторная случайная величина и ее характеристики .......... 17

1.2. Выборочные оценки числовых характеристик случайных величин .......... 20

1.2.1. Точечные оценки числовых характеристик .......... 20

1.2.2. Интервальные оценки числовых характеристик .......... 24

1.3. Проверка статистических гипотез .......... 26

1.3.1. Статистические гипотезы .......... 26

1.3.2. Основные этапы проверки статистических гипотез .......... 27

1.4. Предварительная обработка выборочных данных .......... 29

1.4.1. Фильтрация выборочных данных .......... 29

1.4.2. Аномальные измерения и их исключение из выборочной совокупности .......... 35

1.4.3. Ошибки фильтрации выборочных данных .......... 40

Контрольные вопросы и задания .......... 42

Тема 2. Регрессионные модели и задачи регрессионного анализа .......... 44


2.1. Регрессионный анализ данных и регрессионные модели .......... 44

2.1.1. Регрессионный анализ данных .......... 44

2.1.2. Регрессионные модели .......... 45

2.2. Основные предпосылки и задачи регрессионного анализа .......... 47

2.2.1. Основные предпосылки регрессионного анализа .......... 47

2.2.2. Основные этапы построения регрессионной модели .......... 48

2.2.3. Задачи регрессионного анализа данных .......... 49

Контрольные вопросы и задания .......... 50

Тема 3. Парный регрессионный анализ .......... 51


3.1. Парная регрессия .......... 51

3.1.1. Постановка задачи парной регрессии .......... 51

3.1.2. Выбор вида функции регрессии .......... 55

3.2. Линейная парная регрессия и вычисление ее коэффициентов .......... 58

3.2.1. Метод наименьших квадратов .......... 58

3.2.2. Свойства оценок метода наименьших квадратов .......... 61

3.2.3. Дисперсии оценок метода наименьших квадратов .......... 62

3.2.4. Интерпретация уравнения парной регрессии .......... 63

3.3. Вычисление коэффициентов уравнения регрессии в пакете Mathcad .......... 64

3.3.1. Программирование алгоритмов МНК в Mathcad .......... 64

3.3.2. Функции Mathcad для вычисления оценок МНК .......... 66

3.4. Интервальные оценки функции регрессии и ее параметров .......... 67

3.4.1. Интервальные оценки параметров .......... 67

3.4.2. Интервальные оценки для коэффициентов 0, 1и дисперсии 2 .......... 68

3.4.3. Интервальная оценка для функции регрессии .......... 69

3.4.4. Интервальная оценка для индивидуальных значений зависимой переменной .......... 72

3.5. Значимость уравнения регрессии и коэффициент детерминации .......... 72

3.5.1. Проверка статистической значимости коэффициентов регрессии .......... 73

3.5.2. Проверка статистической значимости выборочного коэффициента корреляции .......... 75

3.5.3. Проверка статистической значимости уравнения регрессии .......... 76

3.6. Нелинейная парная регрессия .......... 80

3.6.1. Нелинейность регрессии по объясняющей переменной .......... 80

3.6.2. Нелинейность по коэффициентам уравнения регрессии .......... 82

3.6.3. Индекс детерминации и значимость нелинейной регрессии .......... 84

3.7. Построение нелинейных парных регрессий в пакете Mathcad .......... 87

3.7.1. Вычисление коэффициентов с использованием стандартных функций Mathcad .......... 87

3.7.2. Вычисление коэффициентов регрессии на основе минимизации функционала .......... 97

3.8. Точностная интерпретация коэффициентов нелинейной парной регрессии .......... 101

3.8.1. Ковариационная матрица коэффициентов уравнения регрессии .......... 101

3.8.2. Интервальные оценки для коэффициентов нелинейной регрессии .......... 106

3.9. Робастные методы оценивания и метод наименьших модулей .......... 109

3.9.1. Робастные методы оценивания параметров .......... 109

3.9.2. Метод наименьших модулей .......... 110

Контрольные вопросы и задания .......... 112

Тема 4. Множественный регрессионный анализ .......... 114


4.1. Линейная модель множественной регрессии и оценивание ее параметров .......... 115

4.1.1. Линейная множественная регрессия .......... 115

4.1.2. Оценка коэффициентов линейной модели методом наименьших квадратов .......... 118

4.1.3. Стандартизованные коэффициенты регрессии и коэффициенты эластичности .......... 121

4.1.4. Свойства оценок метода наименьших квадратов .......... 123

4.1.5. Построение множественной линейной регрессии в Mathcad .......... 126

4.2. Интервальные оценки для функции регрессии и ее коэффициентов .......... 129

4.2.1. Интервальные оценки для коэффициентов j .......... 129

4.2.2. Интервальная оценка для дисперсии 2 .......... 130

4.2.3. Интервальная оценка для множественной функции регрессии .......... 132

4.3. Значимость уравнения множественной регрессии и его коэффициентов .......... 135

4.3.1. Проверка статистической значимости коэффициентов регрессии .......... 135

4.3.2. Проверка статистической значимости уравнения множественной регрессии .......... 136

4.4. Нелинейная множественная регрессия .......... 140

4.4.1. Преобразования нелинейных моделей .......... 140

4.4.2. Минимизация функционала нелинейной множественной регрессии .......... 144

4.5. Точностная интерпретация коэффициентов нелинейной множественной регрессии .......... 146

4.5.1. Ковариационная матрица коэффициентов уравнения регрессии .......... 146

4.5.2. Интервальные оценки для коэффициентов нелинейной регрессии .......... 148

4.6. Исследование остатков регрессионной модели .......... 149

4.6.1. Статистическая характеристика остатков регрессионной модели .......... 149

4.6.2. Общий график остатков .......... 153

4.6.3. График остатков в зависимости от предсказанных значений .......... 155

Контрольные вопросы и задания .......... 155

Тема 5. Практические аспекты множественного регрессионного анализа .......... 158


5.1. Мультиколлинеарность модели множественной регрессии .......... 158

5.1.1. Мультиколлинеарность модели и ее признаки .......... 158

5.1.2. Методы устранения или уменьшения мультиколлинеарности .......... 163

5.2. Отбор объясняющих переменных регрессионной модели .......... 165

5.2.1. Методы отбора значимых переменных .......... 165

5.2.2. Процедура добавления независимых переменных .......... 167

5.3. Неполнота и избыточность уравнения регрессии .......... 171

5.3.1. Неполное уравнение регрессии .......... 171

5.3.2. Избыточное уравнение регрессии .......... 174

5.4. Фиктивные переменные в линейных регрессионных моделях .......... 176

5.4.1. Модели с одной фиктивной переменной .......... 177

5.4.2. Модели с несколькими фиктивными переменными .......... 180

5.5. Частная корреляция .......... 181

5.5.1. Коэффициент частной корреляции .......... 182

5.5.2. Проверка значимости частного коэффициента корреляции .......... 183

5.6. Гетероскедастичность модели и метод взвешенных наименьших квадратов .......... 185

5.6.1. Тест ранговой корреляции Спирмена .......... 185

5.6.2. Метод взвешенных наименьших квадратов .......... 188

5.6.3. Метод взвешенных наименьших квадратов для парной регрессии .......... 189

5.6.4. Двухшаговый метод взвешенных наименьших квадратов .......... 191

Контрольные вопросы и задания .......... 192

Заключение .......... 195

Приложение 1. Лабораторные работы по построению регрессионных моделей .......... 196

Приложение 2. Статистическое моделирование в регрессионном анализе .......... 202

Приложение 3. Содержание прилагаемого компакт-диска (CD) .......... 208

Список литературы .......... 220