Väärä regressio

Väärä regressio viittaa tilanteeseen, jossa käyttöä aikasarja ei paikallaan on lineaarisen regression osoitti virheellisiä tuloksia liian optimistinen, jotka uskovat suhde muuttujien, kun tämä ei pidä paikkaansa.

Historiallinen

Granger ja Newbold osoittivat vuonna 1974, että monet aikasarjojen tilastolliset tutkimukset osoittivat vääriä tuloksia, koska ne eivät ottaneet huomioon tietojen automaattisen korrelaation ongelmaa. Itse asiassa vahvalla autokorrelaatiolla indeksi ja kertoimien testit ovat yleensä liian optimistisia ja uskovat muuttujien väliseen suhteeseen, joka on itse asiassa vain harhaa .

Selitys

On toivottavaa tehdä lineaarinen regressio kahden aika-sarja: jossa valkoista kohinaa .

Jos ja ovat kaksi järjestyksen 1 integroitua muuttujaa , kerroinestimaattorin klassinen jakauma ei ole enää Studentin lain , vaan Brownin liikkeen mukainen . Opiskelijajaon käyttö johtaa kuitenkin juuri näihin liian hyviin tuloksiin.

Todellakin, tavanomaisessa tapauksessa, lähentyminen estimaattorin on pienimmän neliösumman näkyy siitä, että varianssi-kovarianssimatriisi näytteen pyrkii varianssi-kovarianssimatriisi väestöstä, jossa 'otamme että Ω â = σ ε ² · ( X  ' X ) −1 . Järjestyksen 1 integroidun ei-paikallaan pysyvän muuttujan varianssi ei kuitenkaan ole kiinteä, ja siksi estimaattori ei ole yhteneväinen todennäköisyyden vuoksi, koska jäännökset itse ovat integroituneet järjestykseen 1, kuten Philips (1986) on osoittanut. Tämän seurauksena myös Studentin ja Fisherin testit ovat puutteelliset.

Ratkaisu

On olemassa useita tapoja kiertää ongelma. Jos muuttujat integroidaan järjestykseen 1, niiden erojen sarja pysyy paikallaan (integrointijärjestyksen määritelmän mukaan). Sen jälkeen riittää, että tehdään muutosmuuttujien regressio, jotta se tulee voimaan.

Jos ei, on mahdollista käyttää hajautetun viiveen mallia, toisin sanoen mallia, joka sisältää myös selitetyn muuttujan ja selittävän muuttujan viiveet. (Hamilton, 1994, s. 562)

Esimerkki

Simulaatio ilmaisella R-tilasto-ohjelmistolla havainnollistaa ilmiötä:

Kahden satunnaisesti tuotetun valkoisen äänen regressio
Näytetty tulos R-koodi

Soita: lm (kaava = x ~ y)

Jäännökset

Min 1Q Mediaani 3Q Maks
-2,776e + 00 -6.140e-01 -1,208e-03 6.279e-01 3,205e + 00

Kertoimet

Arvio Std. Virhe t-arvo Pr (> | t |)
(Siepata) 0,03447376 0,04348857 0,79270862 0,42832508
y -0.04997771 0,04306249 -1,16058589 0,24636639

Jäännösstandardivirhe: 0,972 498 vapausasteessa

Useita R-neliöitä: 0,0027, Säädettyjä R-neliöitä: 0,000695

F-tilastotiedot: 1,35 1: ssä ja 498 DF, p-arvo: 0,246

set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc summary(lm(x~y)) #Régression linéaire
 

Tässä esimerkissä, jossa me taantua kaksi valkoinen kohina, suhde hylätään: R 2 = 0,002 7, ja todennäköisyys, että y = 0 on 24%.

Kahden satunnaisesti tuotetun satunnaisen käynnin regressio
Näytetty tulos R-koodi

Soita: lm (kaava = x2 ~ y2)

Jäännökset

Min 1Q Mediaani 3Q Maks
-1,357 + 01 -6 564 + 00 -1,047. + 00 6,846e + 00 1.631e + 01

Kertoimet

Arvio Std. Virhe t-arvo Pr (> | t |)
(Siepata) -1,591223e + 01 7.543316e-01 -2,109447e + 01 4.727110e-71
y2 -5.255336e-01 3.562320e-02 -1,475257e + 01 3.990599e-41

Jäännösstandardivirhe: 7,49 498 vapausasteessa

Useita R-neliöitä: 0,304, Säädettyjä R-neliöitä: 0,303

F-tilasto: 218 1: llä ja 498 DF, p-arvo: <2e-16

set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem summary(lm(x2~y2)) #Régression linéaire
 

Toisaalta huomaamme, että satunnaiskävelyjen regressio , jotka ovat järjestyksen 1 integroituja prosesseja, viittaa merkittävään suhteeseen: kerroin R 2 = 0,304 ja todennäköisyys, että y on nolla, on alle 0,000 000 1%, mikä ehdottaa, että muuttujien välillä on suhde. Fisherin tilasto, joka testaa onko regressiolla sinänsä merkitystä, hylätään myös erittäin voimakkaasti.

Kahden satunnaisesti tuotetun satunnaisen käynnin erojen regressio
Näytetty tulos R-koodi

Soita: lm (kaava = x3 ~ y3)

Jäännökset

Min 1Q Mediaani 3Q Maks
-3,503rd + 00 -6,791e-01 -9.397e-03 6.483e-01 3,133e + 00

Kertoimet

Arvio Std. Virhe t-arvo Pr (> | t |)
(Siepata) 0,009479887 0,046269837 0,204882665 0,837747679
y3 0,091363533 0,048239919 1,893940415 0,058813318

Jäännösstandardivirhe: 1,03 497 vapausasteessa

Useita R-neliöitä: 0,00717, Säädettyjä R-neliöitä: 0,00517

F-tilastotiedot: 3,59 / 1 ja 497 DF, p-arvo: 0,0588

set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem x3<-diff(x2) #Série des différences de la marche aléatoire y3<-diff(y2) #idem summary(lm(x3~y3)) #Régression linéaire
 

Kun me taantua erilaisuudesta satunnaiskulku, meillä ei enää ole ongelma ilmeinen suhde: Fisher and Student tilastoja vähemmän jyrkästi, ja ennen kaikkea kerroin R 2 on yhtä kuin 0,007 17, mikä johtaa siihen johtopäätökseen, että näiden muuttujien välillä ei ole yhteyttä.

Huomautuksia ja viitteitä

  1. Granger, CWJ, Newbold, P. (1974): "Väärät regressiot ekonometriassa", Journal of Econometrics , 2, 111-120

Katso myös

Bibliografia

Aiheeseen liittyvät artikkelit

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">