Väärä regressio viittaa tilanteeseen, jossa käyttöä aikasarja ei paikallaan on lineaarisen regression osoitti virheellisiä tuloksia liian optimistinen, jotka uskovat suhde muuttujien, kun tämä ei pidä paikkaansa.
Granger ja Newbold osoittivat vuonna 1974, että monet aikasarjojen tilastolliset tutkimukset osoittivat vääriä tuloksia, koska ne eivät ottaneet huomioon tietojen automaattisen korrelaation ongelmaa. Itse asiassa vahvalla autokorrelaatiolla indeksi ja kertoimien testit ovat yleensä liian optimistisia ja uskovat muuttujien väliseen suhteeseen, joka on itse asiassa vain harhaa .
On toivottavaa tehdä lineaarinen regressio kahden aika-sarja: jossa valkoista kohinaa .
Jos ja ovat kaksi järjestyksen 1 integroitua muuttujaa , kerroinestimaattorin klassinen jakauma ei ole enää Studentin lain , vaan Brownin liikkeen mukainen . Opiskelijajaon käyttö johtaa kuitenkin juuri näihin liian hyviin tuloksiin.
Todellakin, tavanomaisessa tapauksessa, lähentyminen estimaattorin on pienimmän neliösumman näkyy siitä, että varianssi-kovarianssimatriisi näytteen pyrkii varianssi-kovarianssimatriisi väestöstä, jossa 'otamme että Ω â = σ ε ² · ( X ' X ) −1 . Järjestyksen 1 integroidun ei-paikallaan pysyvän muuttujan varianssi ei kuitenkaan ole kiinteä, ja siksi estimaattori ei ole yhteneväinen todennäköisyyden vuoksi, koska jäännökset itse ovat integroituneet järjestykseen 1, kuten Philips (1986) on osoittanut. Tämän seurauksena myös Studentin ja Fisherin testit ovat puutteelliset.
On olemassa useita tapoja kiertää ongelma. Jos muuttujat integroidaan järjestykseen 1, niiden erojen sarja pysyy paikallaan (integrointijärjestyksen määritelmän mukaan). Sen jälkeen riittää, että tehdään muutosmuuttujien regressio, jotta se tulee voimaan.
Jos ei, on mahdollista käyttää hajautetun viiveen mallia, toisin sanoen mallia, joka sisältää myös selitetyn muuttujan ja selittävän muuttujan viiveet. (Hamilton, 1994, s. 562)
Simulaatio ilmaisella R-tilasto-ohjelmistolla havainnollistaa ilmiötä:
Kahden satunnaisesti tuotetun valkoisen äänen regressioNäytetty tulos | R-koodi | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Soita: lm (kaava = x ~ y) Jäännökset
Kertoimet
Jäännösstandardivirhe: 0,972 498 vapausasteessa Useita R-neliöitä: 0,0027, Säädettyjä R-neliöitä: 0,000695 F-tilastotiedot: 1,35 1: ssä ja 498 DF, p-arvo: 0,246 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc summary(lm(x~y)) #Régression linéaire |
Tässä esimerkissä, jossa me taantua kaksi valkoinen kohina, suhde hylätään: R 2 = 0,002 7, ja todennäköisyys, että y = 0 on 24%.
Kahden satunnaisesti tuotetun satunnaisen käynnin regressioNäytetty tulos | R-koodi | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Soita: lm (kaava = x2 ~ y2) Jäännökset
Kertoimet
Jäännösstandardivirhe: 7,49 498 vapausasteessa Useita R-neliöitä: 0,304, Säädettyjä R-neliöitä: 0,303 F-tilasto: 218 1: llä ja 498 DF, p-arvo: <2e-16 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem summary(lm(x2~y2)) #Régression linéaire |
Toisaalta huomaamme, että satunnaiskävelyjen regressio , jotka ovat järjestyksen 1 integroituja prosesseja, viittaa merkittävään suhteeseen: kerroin R 2 = 0,304 ja todennäköisyys, että y on nolla, on alle 0,000 000 1%, mikä ehdottaa, että muuttujien välillä on suhde. Fisherin tilasto, joka testaa onko regressiolla sinänsä merkitystä, hylätään myös erittäin voimakkaasti.
Kahden satunnaisesti tuotetun satunnaisen käynnin erojen regressioNäytetty tulos | R-koodi | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Soita: lm (kaava = x3 ~ y3) Jäännökset
Kertoimet
Jäännösstandardivirhe: 1,03 497 vapausasteessa Useita R-neliöitä: 0,00717, Säädettyjä R-neliöitä: 0,00517 F-tilastotiedot: 3,59 / 1 ja 497 DF, p-arvo: 0,0588 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem x3<-diff(x2) #Série des différences de la marche aléatoire y3<-diff(y2) #idem summary(lm(x3~y3)) #Régression linéaire |
Kun me taantua erilaisuudesta satunnaiskulku, meillä ei enää ole ongelma ilmeinen suhde: Fisher and Student tilastoja vähemmän jyrkästi, ja ennen kaikkea kerroin R 2 on yhtä kuin 0,007 17, mikä johtaa siihen johtopäätökseen, että näiden muuttujien välillä ei ole yhteyttä.