PageRank tai PR on linkki analyysin algoritmi edistää ranking-järjestelmä on verkkosivuja käyttämän hakukoneen Google . Se mittaa määrällisesti verkkosivun suosiota. PageRank on vain yksi indikaattori muiden joukossa algoritmi Sijoitus verkkosivut hakutuloksissa Google. Tämän järjestelmän keksi Larry Page, Googlen perustaja. Tämä sana on rekisteröity tavaramerkki .
Kiintopisteen Lause on matemaattinen käsite, joka on valmistettu laskettaessa PageRank mahdollista .
Perusperiaatteena on antaa jokaiselle sivulle arvo (tai pisteet), joka on verrannollinen siihen kertaan, kuinka monta kertaa käyttäjä ohittaa tämän sivun selaamalla verkkokaaviota napsauttamalla satunnaisesti yhtä kullakin sivulla näkyvää linkkiä. Sivulla on siten PageRank-arvo sitä tärkeämpi, mitä suurempi on siihen linkittävien sivujen PageRanks- summa (mukaan lukien se, jos sisäisiä linkkejä on). PageRank on mitta verkkokeskeisyydestä.
Muodollisemmin käyttäjän liike on satunnainen kävely Web-kaaviossa, toisin sanoen suunnattu kaavio, jonka pisteet edustavat Web-sivuja ja kaaret hyperlinkkejä . Olettaen, että käyttäjä valitsee jokaisen linkin aiemmin vierailtuista sivuista riippumatta (tällaisen oletuksen realismista voidaan keskustella), tämä on Markov-prosessi. PageRank on sitten yksinkertaisesti paikallaan todennäköisyys Markovin ketju , joka on sanoa Perron-Frobenius vektori on vierusmatriisi on Web kuvaajan. Tämän kaavion (jättimäinen) koko ja sen dynaaminen kehitys (sivujen ja hyperlinkkien muutokset, verkkopalvelimen kytkentä tai irrotus jne.) Tekevät kuitenkin ominaisvektorin suoran laskennan mahdottomaksi: käytetään likiarvoalgoritmeja .
Tähän algoritmiin on tehty lukuisia korjauksia ja parannuksia, joista osa on kuvattu patenttihakemuksessa 17. huhtikuuta 2007, muut ovat edelleen vain Googlen tiedossa. Erityisesti on tärkeää varmistaa, että verkkokaavion liian paikalliset muutokset eivät johda tiettyjen sivujen PageRank- arvon suhteettomaan kasvuun , jotta voidaan välttää sitä, että käyttäjät (esimerkiksi kaupalliset sivustot) eivät "lisää" keinotekoisesti PageRankiaan . Esimerkiksi edellä kuvatussa perusalgoritmissa monien sisäisten linkkien lisääminen verkkosivulle (mikä on erittäin helppo tehdä yksilölle) lisää heidän PageRank-arvoa (tämä strategia ei toimi nykyisen PageRank- Googlen kanssa).
Vuoteen 2016 asti Internetin käyttäjät saivat likiarvon kunkin sivun sijoituksesta tutustumalla Google-työkalupalkin PageRank- alueeseen , joka ilmoitti sivun arvon asteikolla 0-10 ( Logaritminen asteikko ). Siihen asti oli myös monia työkaluja sen saamiseksi ilman työkalupalkin näyttämistä, vaikka ne perustuivat myös Google-työkalupalkin palauttamaan arvoon. Vuodesta 2016 lähtien Google ei enää tarjoa mitään PageRank-arvoa, joten sitä on mahdotonta tietää nyt. Jotkut yksityiset yritykset, kuten Moz ja Majestic SEO, yrittävät lähestyä sitä indikaattoreidensa ( viittausvirta , luottamusvirta , verkkotunnuksen auktoriteetti , sivuviranomaiset ) avulla saadakseen käsityksen todellisesta PageRankista ja antaakseen verkkovastaaville mahdollisuuden verrata eri sivustot .
Ennen PageRankin keksimistä Archie yritti vuonna 1990 ja Veronica vuonna 1992; WebCrawler Brain Pinkerton vuonna 1994; ja Louis Monnierin AltaVista-moottori vuonna 1995.
Googlen algoritmi perustuu Eugene Garfieldin vuonna 1964 perustamaan Science Citation Index (SCI) -indeksiin, joka on tieteellisten artikkeleiden sijoitusindeksi, joka perustuu Institute for Science Informationin (ISI) tuottamiin viittauksiin . Google noudattaa lainausperiaatetta ja korvaa saapuvan linkin käsitteen.
Vuonna 1996 Jon Kleinberg nosti IBM: ssä ajatuksen luokituksesta, joka perustuu hypertekstilinkkien rakenteeseen (toisin kuin semanttinen analyysi). Cornellin yliopiston tutkija on myös inspiraation lähde PageRankin luojille .
PageRank- idean esittivät virallisesti ensimmäistä kertaa vuonna 1998 Googlen perustajat Sergey Brin ja Larry Page julkaisussa ”Anatomy of a Large-Scale Hypertexual Web Search Engine”.
Ensimmäinen patentti, menetelmä solmujen luokittelemiseen linkitetyssä tietokannassa , jätettiin kuitenkintammikuu 1997 ennen rekisteröitymistä 9. tammikuuta 1998. Sen omistaa ensin Stanfordin yliopisto, joka sitten myöntää lisenssin Googlelle samana vuonna (muutettu vuosina 2000 ja 2003), kaksi kuukautta perustamisensa jälkeen. Tämä oli yksinoikeuslisenssi vuoteen 2011 asti. PageRank- tekniikan kehittämiseen johtanut tutkimus rahoitettiin osittain National Science Foundation -rahastosta . Siksi patentissa täsmennetään, että hallituksella on tiettyjä oikeuksia tähän keksintöön.
Google-patentin mukaan sijoituskriteerit ovat:
Tämä on kriteeri sivuille myönnetystä auktoriteetista, koska tekijällä on vakavuus ja tunnustettu pätevyys. Tämä kriteeri liittyy valtion sivustoihin ja viitesivustoihin, kuten W3C . Termi TrustRank tulee Yahoo! eikä Googlelta, mikä kuitenkin sisältää myös luottamuskriteerin paikannuksen laskemisessa.
SEO-maailma on tänään samaa mieltä siitä, että Google on ottanut semanttiset arvot huomioon PageRank- laskennassa . Äänet yhdeltä sivulta toiselle, jota edustaa linkki, painotetaan lähetyssivun teemalla. Käytetty sanaryhmä vaikuttaa sivun sijoitukseen hakukoneiden tuloksissa, mutta myös sen välittämien linkkien arvoon.
Google nofollowmääritteli HTML- määritteen arvon relvuonna 2005 W3C: n normatiivisten prosessien ulkopuolella . Googlen mukaan näin luokiteltu linkki verkkosivulle ei välitä mitään PageRank- arvoa näin linkitetyille sivuille. 15. kesäkuuta 2009, Googlen hakemiston laatupäällikkö Matt Cutts ilmoitti muutoksesta linkkien käsittelyssä nofollow. Tämän tyyppinen linkki jätetään edelleen huomiotta, mutta se otetaan epäsuorasti huomioon laskentakaavassa. Tämä hoidon muutos on reaktio verkkovastaavien väärinkäyttöön ( PageRank Sculpting ). Yleensä uusi kaava ottaa huomioon kaikki sivulla olevat linkit (jopa javascript- tai mainoslinkit).
Monet työkalut tarjoavat sivun tulevan sijoituksen laskemisen seuraavan Googlebot- käynnin jälkeen . Nämä työkalut eivät ole luotettavia, koska ne perustuvat yksinomaan Googlen tarkistussumman RK-arvoon . Ainoastaan Google tietää näiden tietojen hyödyllisyyden, eikä sillä ole mitään tekemistä tulevan PageRankin kanssa , lukuun ottamatta transaktioanalyysejä.
Canonical-tunniste, joka on sisällytettävä <head> - ja </head> -tagien väliin, antaa sinun lajitella useiden sivujen välillä, joilla on sama sisältö ja joka antaa hakukoneille vain yhden indeksoitavan sivun. Sitten siirrämme kaksoiskappaleiden arvon yhdelle sivulle, kanoniselle sivulle. Kanonista tunnistetta voidaan käyttää myös paikasta A kohtaan B.
Tapa luokitella, lajitella ja priorisoida algoritmeja ei ole objektiivinen. Se perustuu aina tiettyyn käsitykseen siitä, mikä on tärkeää ja mikä on laillista. PageRank ei ole poikkeus tästä havainnosta.
PageRankin ensimmäinen kriteeri viittaa sivujen sijoitukseen saapuvista linkeistä: mitä suurempi asiakirjaa viittaavien sivujen määrä, sitä tärkeämpää tätä asiakirjaa pidetään. Tämä luokitusperiaate ei ole neutraali tai objektiivinen. Se viittaa sisällön uskottavuuden käsitteeseen, joka on toisen legitimointiperiaatteen vastainen: auktoriteetti - periaate, jonka TrustRank ottaa huomioon . PageRank-sijoituksen periaate vastaa näkyvyyttä - eikä laatua - ja legitiimiyttä. Suurin ongelma on, että algoritmi ei ota huomioon syitä, miksi artikkeliin viitataan, ja on tavallista, että sisältö mainitaan juuri siksi, että se on väärä, mikä saa sopimattomasti merkityksen PageRank-rankingissa.
Toinen mahdollinen ongelma on Matthew-vaikutus : artikkelin korkea sijoitus - viittaustiheyden perusteella - johtaa useampaan viittaukseen, mikä luo silmukan, joka tekee artikkelista yhä näkyvämmän - ja siten laillisen. .
Myös hakukoneoptimoijat ja verkkovastaavat luovat joskus massiivisesti käänteisiä linkkejä vaihtamalla linkkejä tai rekisteröimällä sivuston useisiin hakemistoihin, mikä mahdollisti sisällön suosioindeksin keinotekoisen kasvattamisen. Google reagoi kuitenkin toisaalta luomalla suodattimia, kuten Sandbox, ja toisaalta havaitsemalla massiiviset keinotekoisten linkkien kampanjat ja määräämällä niistä seuraamuksia; lisäksi se integroi laadulliset kriteerit luottamuksen semanttiseen analyysiin, TrustRank- indeksiin, joka tutkii muun muassa käyttäjien käyttäytymistä.