Rakenteellisten yhtälöiden mallinnus tai mallinnus rakenteellisilla yhtälöillä tai mallinnus rakenteellisilla yhtälöillä (englanninkielisillä rakenteellisilla yhtälömallinnuksilla tai SEM: llä) määrittelee monipuolisen joukon matemaattisia malleja, tietokonealgoritmeja ja tilastollisia menetelmiä, jotka vastaavat käsitteiden verkkoa dataan. Sitten puhumme malleista, jotka käyttävät rakenteellisia yhtälöitä, tai malleista, joissa käytetään rakenteellisia yhtälöitä, tai jopa rakenteellisten yhtälöiden malleista.
SEM on usein hyödyllinen yhteiskuntatieteissä, koska sen avulla voidaan analysoida havaittujen muuttujien ja havaitsemattomien muuttujien ( piilevät muuttujat ) välisiä suhteita . Eri rakenteellisten yhtälöiden mallintamismenetelmiä on käytetty tieteessä, liike-elämässä, koulutuksessa ja muilla aloilla.
Mallinnus rakenteellisista yhtälöitä tai mallinnus rakenteellisilla yhtälöitä tai malleja rakenteellisten yhtälöitä tai mallien rakenteellisia yhtälöt, termejä käytetään tällä hetkellä sosiologian, psykologian ja muut sosiaaliset tieteet ovat kehittyneet geneettisiä polku menetelmiä. Mallinnus , jonka Sewall Wright . Nykyaikaiset muodot mahdollistivat 1960- ja 1970-luvuilla toteutetut merkittävät tietokoneiden toteutukset.SEM on kehittynyt kolmella eri polulla:
Suuri osa tästä kehityksestä tapahtui aikana, jolloin laskelmat on automatisoitu korvaamalla laskimen ja analogisten laskentamenetelmien käyttö, jotka itse ovat XIX - luvun lopun innovaatioiden tuotteita .
Kaksi LISREL- ja PLS-PA-ohjelmistoa suunniteltiin iteratiivisina tietokonealgoritmeina, niiden luomisesta lähtien halu tarjota tietojen syöttörajapinta, grafiikka ja Wrigth-menetelmän laajennus (1921). Varhaisina aikoina Cowlesin komissio työskenteli myös yhtälöihin, jotka perustuivat Koopmanin ja Hoodin (1953) algoritmeihin, jotka käsittelivät liikennetaloutta ja optimaalisia reititysongelmia sekä suurimman todennäköisyyden arviointia ja algebrallisia laskelmia. ennen tietokoneita.
Anderson ja Rubin (1949, 1950) kehittivät rajallisen tiedon suurimman todennäköisyyden estimaattorin, joka sisälsi epäsuorasti pienimmän neliösumman menetelmän kaksi vaihetta (Anderson, 2005; Farebrother, 1999). Kaksivaiheisen pienimmän neliösumman menetelmän, joka ehdotettiin alun perin menetelmäksi yhden rakenteellisen yhtälön parametrien arvioimiseksi samanaikaisten yhtälöiden lineaarisessa järjestelmässä, esittelee Theil (1953a, 1953b, 1961) ja vähintään tai vähemmän itsenäisesti Basmann (1957). ) ja Sargan (1958). Näistä menetelmistä kaksivaiheinen pienimmän neliösumman menetelmä oli ylivoimaisesti eniten käytetty menetelmä 1960-luvulla ja 1970-luvun alussa.
Regressioyhtälöjärjestelmät kehitettiin Cowlesin komissiossa 1950-luvulla käyttämällä Tjalling Koopmansin liikennemalleja niiden parantamiseksi . Sewall Wright ja muut tilastotieteilijät yrittänyt edistää ns " polku analyysi " -menetelmällä Cowles (sitten vuoden Chicagon yliopistossa ). Chicagon yliopistossa tilastotieteilijät ovat havainneet monia puutteita näiden analyysien soveltamismenetelmissä. Nämä puutteet eivät aiheuttaneet suuria ongelmia siirtogeenien tunnistamisessa Wrightin yhteydessä, mutta tekivät PLS-PA- ja LISREL-menetelmistä ongelmallisia yhteiskuntatieteiden alalla . Freedman (1987) tiivisti nämä väitteet: "Kyvyttömyys erottaa syy-oletuksia, tilastollisia vaikutuksia ja poliittisia väitteitä on ollut yksi tärkeimmistä syistä epäilyihin ja sekaannukseen kvantitatiivisten menetelmien ympärillä tieteessä. Sosiaalinen" (ks. Myös Woldin vastaus) vuonna 1987). Amerikkalaiset ekonometristit eivät koskaan seuranneet Wrightin analyysiä laajalti, mutta se vaikutti vaikuttavasti Hermann Woldiin ja hänen oppilaansa Karl Jöreskögiin. Jöreskögin opiskelija Claes Fornell esitteli LISRELin Yhdysvaltoihin.
Tietokoneiden kehitys on laajentanut rakenteellisten yhtälömenetelmien soveltamista suuriin, monimutkaisiin ja strukturoimattomiin tietojoukkoihin. Suosituimmat tekniset ratkaisut jaetaan kolmeen algoritmiluokkaan:
Pearl rikastuttaa SEM: iä soveltamalla niihin ei-parametrisia malleja ja ehdottamalla yhtälöiden syy- ja vastakohtaisia tulkintoja. Esimerkiksi muuttujan poissulkeminen yhtälön argumenteista tarkoittaa sanomista, että riippuva muuttuja on riippumaton poissuljetun muuttujan muutoksista, kun muut argumentit pidetään vakioina. Ei-parametriset SEM-arvot mahdollistavat kokonais-, suorien ja epäsuorien vaikutusten arvioimisen sitoutumatta yhtälöiden muotoon tai virhetermien jakautumiseen. Tämä rikastaa välityksen analysointia järjestelmiin, joilla on kategorisia muuttujia epälineaaristen vuorovaikutusten läsnä ollessa. Bollen ja Pearl tarkastelevat SEM: n kausaalisen tulkinnan historiaa ja sitä, miksi siitä on tullut sekaannusten ja kiistojen lähde.
Vaikka kukin SEM-tekniikka on erilainen, tässä esitetään eri SEM-menetelmille yhteiset näkökohdat.
SEM: ssä erotetaan kaksi pääkomponenttia: rakennemallilla pyritään tuomaan esiin mahdolliset syy-riippuvuudet endogeenisten ja eksogeenisten muuttujien välillä; ja mittausmalli, joka näyttää piilevien muuttujien ja niiden indikaattorien väliset suhteet. Factor analysis mallit (joko valmisteleva tai uudistettuun) sisältää vain mittauksen osa, kun taas rakenteelliset polku kaaviot sisältävät vain rakenteellinen osa.
Kun määritellään reittiä ( reitit ) malli, mallintaja voi aiheuttaa kahdenlaisia suhteita:
Mallintaja määrittelee usein joukon teoreettisesti uskottavia malleja arvioidakseen, onko ehdotettu malli paras mahdollisten mallien sarjassa. Sen on otettava huomioon paitsi mallin rakentamisen taustalla olevat teoreettiset syyt myös sen datapisteiden ja parametrien määrä, jotka mallin on arvioitava mallin tunnistamiseksi. Tunnistettu malli on malli, jossa tietty parametriarvo riittää mallin tunnistamiseen, eikä mitään muuta vastaavaa formulaatiota voida antaa millään muulla parametriarvolla. Datapiste on muuttuja, jossa havaitaan pisteitä, kuten muuttuja, joka sisältää pisteet kysymyksestä. Parametri on mallintajaa kiinnostava arvo. Se voi olla regressiokerroin eksogeenisen ja endogeenisen muuttujan välillä; se voi olla tekijän paino (indikaattorin ja sen tekijän välinen regressiokerroin). Jos datapisteitä on vähemmän kuin arvioitujen parametrien lukumäärä, tuloksena oleva malli on "tunnistamaton", koska vertailuarvoja on liian vähän mallin koko varianssin huomioon ottamiseksi. Ratkaisu on rajoittaa yksi poluista nollaan, mikä tarkoittaa, että se ei ole enää osa mallia.
Parametrien estimointi tehdään vertaamalla todellisia kovarianssimatriiseja, jotka osoittavat muuttujien ja parhaalla mallilla arvioitujen kovarianssimatriisien väliset suhteet. Tämä vertailu saadaan säätökriteerillä, joka lasketaan useiden arvioiden perusteella: arvio suurimmasta todennäköisyydestä , arvio lähes maksimi todennäköisyydestä, arvio painotetuista pienimmistä neliöistä tai menetelmät asymptoottisten jakaumien ja vapaiden jakaumien osalta. Laskenta tehdään erikoistuneilla SEM-ohjelmilla.
Arvioidessaan mallin analyytikot haluavat tulkita mallin. Arvioidut rakenteet (tai polut) voidaan taulukoida ja / tai esittää graafisesti iteratiivisen rakennemallin ( polumalli ) muodossa. Muuttujien vaikutus arvioidaan polun jäljityssääntöjen avulla .
On tärkeää tutkia arvioidun mallin sopivuus sen määrittämiseksi, mallinnetaanko se tietoja hyvin. Tämä on SEM-mallinnuksen perustehtävä: päättää mallien hyväksymisen tai hylkäämisen perusteista ja yleisesti ottaen yhden kilpailevan mallin hyväksymisestä toiseen. SEM-ohjelmien tuotos sisältää matriisit mallin muuttujien välisten suhteiden arvioimiseksi. Hyvän hyvyyden arvioiminen on laskea, kuinka samankaltainen ennustettu data on matriiseihin, jotka sisältävät todellisten tietojen väliset suhteet.
Tätä tarkoitusta varten on kehitetty tilastollisia testejä ja sopivuusindeksejä. Arvioidussa mallissa voidaan myös tutkia yksittäisiä malliparametreja sen selvittämiseksi, kuinka ehdotettu malli sopii mallia ohjaavaan teoriaan. Useimmat arviointimenetelmät mahdollistavat tällaisen estimaatin tekemisen.
Kuten kaikkien hypoteesitestaukseen perustuvien tilastojen kohdalla , mallin SEM-mallintestaus perustuu oletukseen, että asiaankuuluvia, oikeita ja täydellisiä tietoja käytetään. SEM-kirjallisuudessa sopivuuskeskustelut ovat johtaneet moniin suosituksiin erilaisten indeksi- ja hypoteesitestien tarkasta soveltamisesta.
Sopivuuden arvioimiseksi on olemassa erilaisia lähestymistapoja. Perinteiset lähestymistavat lähtevät nollahypoteesista , suosien parsimonisia malleja (niitä, joilla on vähemmän vapaita parametreja). Koska erilaiset sovitusmitat sieppaavat mallin istuvuuden eri elementit, tuloksissa tulisi ilmoittaa valikoima erilaisia sopivuusmittauksia. Hyvät käytännöt (päätöksentekopisteen soveltaminen, raja-arvot ) soveltuvien toimenpiteiden tulkinnassa, mukaan lukien alla luetellut, ovat paljon keskustelua SEM-tutkijoiden keskuudessa.
Joitakin eniten käytettyjä säätötoimenpiteitä ovat:
Kunkin sopivuusmittauksen osalta päätöksessä siitä, mikä on riittävän hyvä sovitus mallin ja datan välillä, on otettava huomioon muut asiayhteyteen vaikuttavat tekijät: otoksen koko, indikaattoreiden suhde tekijöihin ja mallin yleinen monimutkaisuus. Esimerkiksi erittäin suuret näytteet tekevät Chi-neliöstä liian herkän ja osoittavat todennäköisemmin mallien ja tietojen välisen sovituksen puutteen.
Mallia saatetaan joutua muuttamaan muuttujien välisen suhteen sopivuuden ja siten todennäköisimmän estimaatin parantamiseksi. Monet ohjelmat tarjoavat muutosvihjeitä, jotka voivat ohjata pieniä muutoksia. Muutosindeksit osoittavat muutoksen χ 2, joka vapauttaa kiinteät parametrit. Yleensä tämä johtaa iteraation ( polun ) avaamiseen mallissa, joka asettaa sen nollaksi. Mallin sopivuutta parantavat muutokset voidaan raportoida mahdollisina muutoksina, jotka malliin voidaan tehdä. Malliin tehdyt muutokset ovat muutoksia teoriassa. Siksi ne on tulkittava suhteessa testattavaan teoriaan tai ne on tunnustettava teorian rajoiksi. Muutokset mittausmallissa (tekijäanalyysi) ovat osoitus siitä, että kohteet / tiedot ovat epäpuhtaita indikaattoreita teoriassa määritetyistä latenteista muuttujista.
MI ei saisi johtaa malleja, kuten Maccallum (1986) osoitti: ”Vaikka olosuhteet olisivatkin suotuisat, tutkimuksen määrittelyihin perustuvia malleja tulisi tarkastella varoen. "
Vaikka tutkijat ovat yhtä mieltä siitä, että SEM-mallien riittävän tilastollisen tehon ja tarkkuuden aikaansaamiseksi tarvitaan suuria otoskokoja , ei ole yleistä yksimielisyyttä sopivasta menetelmästä otoksen oikean koon määrittämiseksi. Yleensä otokoon määritettäessä huomioon otettavat tekijät sisältävät havaintojen lukumäärän parametria kohti, indeksien oikaisun suorittamiseksi tarvittavien havaintojen määrän ja havaintojen määrän kullekin vapausasteelle.
Tutkijat ovat ehdottaneet suuntaviivoja, jotka perustuvat työkokemuksen simulointitutkimuksiin ja matemaattisiin kaavoihin. Otoskokovaatimukset tietyn merkitsevyyden ja tehon saavuttamiseksi hypoteesitestauksessa SEM: ssä ovat samanlaisia samalla mallilla käytetystä algoritmista (PLS-PA, LISREL tai yhtälöjärjestelmien regressio) riippumatta.
Mallisarja tulkitaan sitten siten, että johtopäätökset voidaan tehdä sopivimman mallin perusteella.
Syy-yhteyden löytämisessä on aina oltava varovainen. Termi kausaalimalli tulisi ymmärtää "kausaalisten oletusten mallina" eikä mallina, joka tuottaa lopulliset johtopäätökset. Tietojen kerääminen useina ajankohtina ja kokeellinen tai näennäiskokeellinen kokoonpano voivat auttaa poistamaan kilpailevat hypoteesit, mutta ei riitä poistamaan syy-seurauksen vaaroja. Hyvä syy yhden syy-oletuksen kanssa yhteensopivan mallin mukaan tarkoittaa aina yhtä hyvää sovitusta malliin, joka on yhteensopiva vastakkaisen syy-oletuksen kanssa. Mikään kokeellinen suunnittelu, edes älykkäin, ei voi auttaa erottamaan tällaisia kilpailevia hypoteeseja, lukuun ottamatta interventiokokeita.
Kuten missä tahansa tieteessä, myöhempi replikointi ja mahdollisesti mallin muokkaaminen seuraa alkuperäistä löytöä.
Tietojen käsittelemiseksi käytetään useita ohjelmistoja arvioimaan rakennekaavamallien sopivuus. 1970-luvulla julkaistu LISREL oli ensimmäinen tämän tyyppinen ohjelmisto. Muita erillisiä ohjelmistoja ovat: Mplus, Mx, EQS, Stata ja avoimen lähdekoodin Onyx. Lisäksi SPSS: n Amos-laajennus on omistettu rakennemallinnukselle.
Avoimen lähdekoodin R- tilastolliselle ympäristölle on myös useita kirjastoja . Semi-, laava- ja lavaanikirjastoja voidaan käyttää rakennekaavamalleissa. SpareSS- ja regsem-kirjastot tarjoavat säännöllisiä arviointimenettelyjä (kuten Lasso ja Ridge). RAMpath tarjoaa muita rutiinimallien spesifikaatioita ja muita ominaisuuksia, mutta parametrien estimoinnin tarjoavat muut paketit .
OpenMx-kirjasto tarjoaa avoimen lähdekoodin ja parannetun version Mx-ohjelmistosta.
Tutkijoiden mielestä on hyvä tieteellinen käytäntö mainita aina SEM-analyysin suorittamiseen käytetty ohjelmisto, koska he saattavat käyttää hieman erilaisia menetelmiä.
Ihmisen älykkyyden käsitettä ei voida mitata suoraan, koska voidaan mitata henkilön pituus tai paino. Psykologit kehittävät hypoteesin älykkyyden suunnittelun mittauslaitteista, joissa on kohteita (kysymyksiä), jotka on suunniteltu mittaamaan älykkyyttä hypoteesiensa mukaan. Sitten he käyttävät SEM: ää hypoteesiensa testaamiseen: SEM-analyysissä älykkyys on piilevä muuttuja ja testipisteet ovat havaittuja muuttujia.
Vastakkaisessa kuvassa on yksinkertaistettu malli, jossa älykkyys (mitattuna neljällä kysymyksellä) voi ennustaa akateemisen suorituskyvyn (mitattuna SAT-, ACT- ja GPA-testeillä). SEM-kaavioissa piilevät muuttujat esitetään yleisesti soikeina ja mitatut tai manifestiarvot suorakulmioina. Kaavio osoittaa, kuinka virhe ( e ) vaikuttaa jokaiseen pisteeseen, mutta sillä ei ole vaikutusta piileviin muuttujiin. SEM-analyysi antaa numeeriset arviot kunkin parametrin (nuolet) välisen suhteen vahvuudesta. Näin ollen SEM-analyysi ei vain anna mahdollisuuden testata yleistä teoriaa, vaan antaa tutkijan myös diagnosoida, ovatko havaitut muuttujat hyviä piilevien muuttujien indikaattoreita.
SEM-menetelmien kriitikot keskittyvät useimmiten matemaattiseen muotoiluun, tiettyjen hyväksyttyjen mallien ulkoisen pätevyyden heikkouteen ja vakiomenettelyihin liittyvään filosofiseen ennakkoluuloon.
Terminologista sekaannusta on käytetty piilottamaan joidenkin menetelmien heikkoudet. Erityisesti PLS-PA (Lohmoller-algoritmi) on sekoitettu PLSR: n osittaisen pienimmän neliösumman regressioon, joka korvaa pienimmän neliösumman regression eikä sillä ole mitään tekemistä rakenneanalyysin ( polun analyysi ) kanssa. PLS-PA: ta on väärin mainostettu menetelmänä, joka toimii pienten tietojoukkojen kanssa. Westland (2010) mitätöi tämän lähestymistavan ja kehitti algoritmin SEM: ssä tarvittavien otoskokojen määrittämiseksi. 1970-luvulta lähtien väitteet pienten otoskokojen mahdollisesta käytöstä on tunnustettu virheellisiksi (ks. Esimerkiksi Dhrymes, 1972, 1974; Dhrymes & Erlat, 1972; Dhrymes et ai., 1972; Gupta, 1969; Sobel, 1982 ).
Scales Management Manual , kokoelma monipisteisiä asteikkoja, joita aiemmin käytettiin SEM-rakenteiden mittaamiseen