Исследование регрессии на основе численных данных

Курсовой проект - Математика и статистика

Другие курсовые по предмету Математика и статистика

410,902193407625,65428096-0,157850962-0,066858559727,64206368-0,158793684-0,067257854828,29199401-2,615064008-1,107623355928,60678281-0,951262807-0,4029120891029,30284597-0,669585972-0,2836064661129,701759360,6042206350,2559206531231,68682839-1,72447839-0,7304113921339,473780640,0409493620,0173443061440,1725575-1,064897499-0,4510426271540,2906033-1,054643299-0,446699411642,42628248-0,465192483-0,1970345881742,633880270,8757897310,3709450931843,990728543,7271614571,5786577561949,808893942,3941560561,0140566952052,012415543,6226044581,534372122152,22679757-3,70780757-1,5704603212252,25800508-2,05527508-0,8705219732352,536158980,0542510240,0229782912454,02869208-2,129202078-0,9018341212557,779020710,7049892910,2986017182659,16979019-2,02417019-0,8573473432759,416736581,2483934240,5287632382860,639256876,5083031292,7566241322961,43301311-2,101883112-0,8902630373063,70709082-2,91903082-1,236370009

Новое уравнение регрессии сравним с первоначальным:

y = 3*x + 4 y= 2,963989827*x+ 4,427294273

Коэффициент при переменной X отклоняется от истинного значения приблизительно на 0,036. При этом константа изменяется по сравнению с заданной приблизительно на 0,4273.

4.Полагая вместо Vi значения 0,5Vi; 1,5Vi и так далее, получим новые пары выборок и вновь вычислим уравнение линейной регрессии.

Vi=0,5Vi:

Ui0,5Vi0,9026550,130379-0,88288-0,354231,7715322,411907-0,53499-0,811952,9018971,1556862,356710,0057761,067474-0,006770,907062-1,23886-0,19715-0,40887-0,28407-0,272260,748350,3622250,36609-0,814181,2471260,02123-1,05005-0,53594-0,84576-0,531542,296219-0,24978-1,300350,4194521,6164591,8368980,5739481,1350474,0744641,7358890,477646-1,93062-0,18024-1,104550,706505-0,05147-0,10416-1,15226-1,48260,2420510,352875-1,13098-3,491280,5038062,1222013,126334-2,38327-1,183580,274958-1,60597Yi = Y+0,5Vi

XYi=Y+0,5Vi519,1303795,5320,2470766,4325,7008266,5122,7131876,8325,6476447,1625,4906547,8327,4900418,0526,9157828,1628,0643868,3928,9055158,5329,9437559,2030,77653611,8239,49350412,0639,643612,1039,76748512,8242,21086612,8943,09021813,3545,88099715,3151,06799816,0553,89913316,1350,4496116,1451,30727216,2352,6418816,7353,05175618,0058,24195918,4758,276618,5560,16132718,9664,02122819,2360,5147142062,39403Уравнение регрессии: y= 2,981994985*x+4,2136464

коэффициент детерминации R2: 0,993246535

доверительные интервалы для коэффициентов:

Y: (2,949279007; 5,478013793)

X : (2,886807583; 3,077182386).

стандартные ошибки коэффициентов: Y: 0,61724349 X: 0,046468933

F-статистика: 4118,019632.

 

Остатки и стандартные остатки:

НаблюдениеПредсказанное YiОстаткиСтандартные остатки119,123621320,0067571770,005724072220,715317-0,468240808-0,396651406323,386799372,314026361,960234548423,62159496-0,908407965-0,769521345524,582618761,0650256090,902193696625,56957929-0,078925712-0,066858749727,56943707-0,079396252-0,067257348828,22331548-1,307533194-1,107624262928,54001651-0,475630982-0,4029116951029,240308-0,334792685-0,2836061851129,641644650,3021100490,2559204021231,63877224-0,862235975-0,7304085971339,473027390,0204765470,0173458851440,17604906-0,532448672-0,451042521540,29481195-0,527326592-0,4467035561642,4434646-0,232598222-0,1970362471742,652323470,4378948490,3709450441844,01741411,8635826421,5786592331949,870922741,1970750971,0140541192052,087829931,8113025821,5343722782152,30351425-1,853904136-1,5704604742252,33491133-1,027639563-0,8705236072352,614754910,0271251070,0229779462454,11635461-1,06459837-0,9018317772557,889465120,3524938290,2986009992659,28868301-1,01208332-0,857345762759,537129510,6241972780,5287636692860,767076173,2541515842,7566238952961,56565419-1,050940174-0,8902617843063,85354609-1,45951609-1,236370472

Новое уравнение регрессии сравним с первоначальным:

y = 3*x + 4 y= 2,981994985*x+4,2136464

Коэффициент при переменной X отклоняется от истинного значения приблизительно на 0,01801. При этом константа изменяется по сравнению с заданной приблизительно на 0, 21365.

 

Vi=1,5Vi:

Ui1,5Vi0,9026550,391136-0,88288-1,062691,7715327,235721-0,53499-2,435842,9018973,4670582,356710,0173271,067474-0,020310,907062-3,71657-0,19715-1,2266-0,28407-0,816770,748351,0866740,36609-2,442541,2471260,06369-1,05005-1,60782-0,84576-1,594612,296219-0,74934-1,300351,2583561,6164595,5106930,5739483,4051414,0744645,2076670,477646-5,79186-0,18024-3,313640,706505-0,15441-0,10416-3,45678-1,48260,7261520,352875-3,39293-3,491281,5114172,1222019,379001-2,38327-3,550740,274958-4,81791

Yi=Y+1,5Vi

XYi=Y+1,5Vi519,3911365,5319,5386166,4330,524646,5121,0892976,8327,9590167,1625,5022057,8327,4765018,0524,4380728,1627,2466568,3928,3610058,5330,6682049,2029,14817611,8239,53596412,0638,5717212,1038,70441512,8241,71130612,8943,92912213,3549,55479215,3153,33809216,0557,37091116,1346,5883716,1449,09818216,2352,5389416,7350,74723618,0058,7260618,4756,0146518,5561,16893818,9670,27389519,2358,1475542059,18209

Уравнение регрессии: y= 2,945984954*x+ 4,6409392

коэффициент детерминации R2: 0,940999679

доверительные интервалы для коэффициентов:

Y: (0,84783702; 8,43404138)

X : (2,660422749; 3,231547158).

стандартные ошибки коэффициентов: Y: 1,851730471 X: 0,1394068

F-статистика: 446,5736918.

 

Остатки и стандартные остатки:

 

НаблюдениеПредсказанное YiОстаткиСтандартные остатки119,370863970,0202715320,005724072220,94333862-1,404722425-0,396651406323,582560656,9420790811,960234548423,81452089-2,725223896-0,769521345524,763939543,1950768280,902193696625,73898172-0,236777137-0,066858749727,71468957-0,238188757-0,067257348828,36067187-3,922599581-1,107624262928,67354847-1,426892945-0,4029116951029,36538337-1,004378055-0,2836061851129,761873550,9063301480,2559204021231,7348842-2,586707926-0,7304085971339,474534290,0614296420,0173458851440,16906641-1,597346015-0,451042521540,28639513-1,581979776-0,4467035561642,40910105-0,697794666-0,1970362471742,615437771,3136845470,3709450441843,964043825,5907479271,5786592331949,746866543,5912252921,0140541192051,937002765,4339077461,5343722782152,15008252-5,561712407-1,5704604742252,18110046-3,082918689-0,8705236072352,45756470,0813753220,0229779462453,94103135-3,19379511-0,9018317772557,668578461,0574814880,2986009992659,05089965-3,036249959-0,857345762759,296345951,8725918330,5287636692860,511449,7624547532,7566238952961,30037454-3,152820522-0,8902617843063,56063827-4,37854827-1,236370472

 

 

Новое уравнение регрессии сравним с первоначальным:

y = 3*x + 4 y= 2,945984954*x+ 4,6409392

Коэффициент при переменной X отклоняется от истинного значения приблизительно на 0,05402. При этом константа изменяется по сравнению с заданной приблизительно на 0, 6409.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

В данном случае максимально близким к истинной зависимости будет следующее уравнение:

y= 3,000827144*x+ 4,032964241.

Оно получается при дисперсии 0,5, неизменной выборке X, минимально измененной выборке Y. В этом случае коэффициент детерминации R максимален (0,999575198),

стандартные ошибки коэффициентов минимальны (Y: 0,155289144; X: 0,011690882).

Сравнивая полученные для каждого вычисления графики, также можно прийти к выводу о том, что указанное ранее уравнение является наиболее точным по отношению к истинной зависимости.

Чем меньше дисперсия выборки и изменения выборок X иY, тем точнее уравнение линейной регрессии по отношению к истинной зависимости.

Таким образом, на основе данных, полученных в результате исследования, можно сделать следующие выводы:

  1. уравнение линейной регрессии зависит от дисперсии выборки;
  2. уравнение линейной регрессии зависит от изменения двух выборок X иY.