Sivujärjestys

PageRank tai PR on linkki analyysin algoritmi edistää ranking-järjestelmä on verkkosivuja käyttämän hakukoneen Google . Se mittaa määrällisesti verkkosivun suosiota. PageRank on vain yksi indikaattori muiden joukossa algoritmi Sijoitus verkkosivut hakutuloksissa Google. Tämän järjestelmän keksi Larry Page, Googlen perustaja. Tämä sana on rekisteröity tavaramerkki .

Kiintopisteen Lause on matemaattinen käsite, joka on valmistettu laskettaessa PageRank mahdollista .

Operaatio

Perusperiaatteena on antaa jokaiselle sivulle arvo (tai pisteet), joka on verrannollinen siihen kertaan, kuinka monta kertaa käyttäjä ohittaa tämän sivun selaamalla verkkokaaviota napsauttamalla satunnaisesti yhtä kullakin sivulla näkyvää linkkiä. Sivulla on siten PageRank-arvo sitä tärkeämpi, mitä suurempi on siihen linkittävien sivujen PageRanks- summa (mukaan lukien se, jos sisäisiä linkkejä on). PageRank on mitta verkkokeskeisyydestä.

Muodollisemmin käyttäjän liike on satunnainen kävely Web-kaaviossa, toisin sanoen suunnattu kaavio, jonka pisteet edustavat Web-sivuja ja kaaret hyperlinkkejä . Olettaen, että käyttäjä valitsee jokaisen linkin aiemmin vierailtuista sivuista riippumatta (tällaisen oletuksen realismista voidaan keskustella), tämä on Markov-prosessi. PageRank on sitten yksinkertaisesti paikallaan todennäköisyys Markovin ketju , joka on sanoa Perron-Frobenius vektori on vierusmatriisi on Web kuvaajan. Tämän kaavion (jättimäinen) koko ja sen dynaaminen kehitys (sivujen ja hyperlinkkien muutokset, verkkopalvelimen kytkentä tai irrotus jne.) Tekevät kuitenkin ominaisvektorin suoran laskennan mahdottomaksi: käytetään likiarvoalgoritmeja .

Tähän algoritmiin on tehty lukuisia korjauksia ja parannuksia, joista osa on kuvattu patenttihakemuksessa 17. huhtikuuta 2007, muut ovat edelleen vain Googlen tiedossa. Erityisesti on tärkeää varmistaa, että verkkokaavion liian paikalliset muutokset eivät johda tiettyjen sivujen PageRank- arvon suhteettomaan kasvuun , jotta voidaan välttää sitä, että käyttäjät (esimerkiksi kaupalliset sivustot) eivät "lisää" keinotekoisesti PageRankiaan . Esimerkiksi edellä kuvatussa perusalgoritmissa monien sisäisten linkkien lisääminen verkkosivulle (mikä on erittäin helppo tehdä yksilölle) lisää heidän PageRank-arvoa (tämä strategia ei toimi nykyisen PageRank- Googlen kanssa).

Vuoteen 2016 asti Internetin käyttäjät saivat likiarvon kunkin sivun sijoituksesta tutustumalla Google-työkalupalkin PageRank- alueeseen , joka ilmoitti sivun arvon asteikolla 0-10 ( Logaritminen asteikko ). Siihen asti oli myös monia työkaluja sen saamiseksi ilman työkalupalkin näyttämistä, vaikka ne perustuivat myös Google-työkalupalkin palauttamaan arvoon. Vuodesta 2016 lähtien Google ei enää tarjoa mitään PageRank-arvoa, joten sitä on mahdotonta tietää nyt. Jotkut yksityiset yritykset, kuten Moz ja Majestic SEO, yrittävät lähestyä sitä indikaattoreidensa ( viittausvirta , luottamusvirta , verkkotunnuksen auktoriteetti , sivuviranomaiset ) avulla saadakseen käsityksen todellisesta PageRankista ja antaakseen verkkovastaaville mahdollisuuden verrata eri sivustot .

Historiallinen

Edeltäjät

Ennen PageRankin keksimistä Archie yritti vuonna 1990 ja Veronica vuonna 1992; WebCrawler Brain Pinkerton vuonna 1994; ja Louis Monnierin AltaVista-moottori vuonna 1995.

Googlen algoritmi perustuu Eugene Garfieldin vuonna 1964 perustamaan Science Citation Index (SCI) -indeksiin, joka on tieteellisten artikkeleiden sijoitusindeksi, joka perustuu Institute for Science Informationin (ISI) tuottamiin viittauksiin . Google noudattaa lainausperiaatetta ja korvaa saapuvan linkin käsitteen.

Vuonna 1996 Jon Kleinberg nosti IBM: ssä ajatuksen luokituksesta, joka perustuu hypertekstilinkkien rakenteeseen (toisin kuin semanttinen analyysi). Cornellin yliopiston tutkija on myös inspiraation lähde PageRankin luojille .

PageRankin syntymä

PageRank- idean esittivät virallisesti ensimmäistä kertaa vuonna 1998 Googlen perustajat Sergey Brin ja Larry Page julkaisussa ”Anatomy of a Large-Scale Hypertexual Web Search Engine”.

Ensimmäinen patentti, menetelmä solmujen luokittelemiseen linkitetyssä tietokannassa , jätettiin kuitenkintammikuu 1997 ennen rekisteröitymistä 9. tammikuuta 1998. Sen omistaa ensin Stanfordin yliopisto, joka sitten myöntää lisenssin Googlelle samana vuonna (muutettu vuosina 2000 ja 2003), kaksi kuukautta perustamisensa jälkeen. Tämä oli yksinoikeuslisenssi vuoteen 2011 asti. PageRank- tekniikan kehittämiseen johtanut tutkimus rahoitettiin osittain National Science Foundation -rahastosta . Siksi patentissa täsmennetään, että hallituksella on tiettyjä oikeuksia tähän keksintöön.

Tärkeimmät kriteerit verkkosivun pisteytykselle

Google-patentin mukaan sijoituskriteerit ovat:

saapuvat ja lähtevät linkit;
ankkurit;
sivuun liittyvä liikenne;
Internet-käyttäjän käyttäytyminen: sivun valinta tuloksissa;
verkkotunnus .

Työkalut ja arvot

TrustRank

Tämä on kriteeri sivuille myönnetystä auktoriteetista, koska tekijällä on vakavuus ja tunnustettu pätevyys. Tämä kriteeri liittyy valtion sivustoihin ja viitesivustoihin, kuten W3C . Termi TrustRank tulee Yahoo! eikä Googlelta, mikä kuitenkin sisältää myös luottamuskriteerin paikannuksen laskemisessa.

PageRank teema

SEO-maailma on tänään samaa mieltä siitä, että Google on ottanut semanttiset arvot huomioon PageRank- laskennassa . Äänet yhdeltä sivulta toiselle, jota edustaa linkki, painotetaan lähetyssivun teemalla. Käytetty sanaryhmä vaikuttaa sivun sijoitukseen hakukoneiden tuloksissa, mutta myös sen välittämien linkkien arvoon.

ei seurata

Google nofollowmääritteli HTML- määritteen arvon relvuonna 2005 W3C: n normatiivisten prosessien ulkopuolella . Googlen mukaan näin luokiteltu linkki verkkosivulle ei välitä mitään PageRank- arvoa näin linkitetyille sivuille. 15. kesäkuuta 2009, Googlen hakemiston laatupäällikkö Matt Cutts ilmoitti muutoksesta linkkien käsittelyssä nofollow. Tämän tyyppinen linkki jätetään edelleen huomiotta, mutta se otetaan epäsuorasti huomioon laskentakaavassa. Tämä hoidon muutos on reaktio verkkovastaavien väärinkäyttöön ( PageRank Sculpting ). Yleensä uusi kaava ottaa huomioon kaikki sivulla olevat linkit (jopa javascript- tai mainoslinkit).

Tuleva PageRank

Monet työkalut tarjoavat sivun tulevan sijoituksen laskemisen seuraavan Googlebot- käynnin jälkeen . Nämä työkalut eivät ole luotettavia, koska ne perustuvat yksinomaan Googlen tarkistussumman RK-arvoon . Ainoastaan Google tietää näiden tietojen hyödyllisyyden, eikä sillä ole mitään tekemistä tulevan PageRankin kanssa , lukuun ottamatta transaktioanalyysejä.

Kanoninen tunniste

Canonical-tunniste, joka on sisällytettävä <head> - ja </head> -tagien väliin, antaa sinun lajitella useiden sivujen välillä, joilla on sama sisältö ja joka antaa hakukoneille vain yhden indeksoitavan sivun. Sitten siirrämme kaksoiskappaleiden arvon yhdelle sivulle, kanoniselle sivulle. Kanonista tunnistetta voidaan käyttää myös paikasta A kohtaan B.

Kriittinen

Tapa luokitella, lajitella ja priorisoida algoritmeja ei ole objektiivinen. Se perustuu aina tiettyyn käsitykseen siitä, mikä on tärkeää ja mikä on laillista. PageRank ei ole poikkeus tästä havainnosta.

PageRankin ensimmäinen kriteeri viittaa sivujen sijoitukseen saapuvista linkeistä: mitä suurempi asiakirjaa viittaavien sivujen määrä, sitä tärkeämpää tätä asiakirjaa pidetään. Tämä luokitusperiaate ei ole neutraali tai objektiivinen. Se viittaa sisällön uskottavuuden käsitteeseen, joka on toisen legitimointiperiaatteen vastainen: auktoriteetti - periaate, jonka TrustRank ottaa huomioon . PageRank-sijoituksen periaate vastaa näkyvyyttä - eikä laatua - ja legitiimiyttä. Suurin ongelma on, että algoritmi ei ota huomioon syitä, miksi artikkeliin viitataan, ja on tavallista, että sisältö mainitaan juuri siksi, että se on väärä, mikä saa sopimattomasti merkityksen PageRank-rankingissa.

Linkkikisa ja Matthew-vaikutus

Toinen mahdollinen ongelma on Matthew-vaikutus : artikkelin korkea sijoitus - viittaustiheyden perusteella - johtaa useampaan viittaukseen, mikä luo silmukan, joka tekee artikkelista yhä näkyvämmän - ja siten laillisen. .

Myös hakukoneoptimoijat ja verkkovastaavat luovat joskus massiivisesti käänteisiä linkkejä vaihtamalla linkkejä tai rekisteröimällä sivuston useisiin hakemistoihin, mikä mahdollisti sisällön suosioindeksin keinotekoisen kasvattamisen. Google reagoi kuitenkin toisaalta luomalla suodattimia, kuten Sandbox, ja toisaalta havaitsemalla massiiviset keinotekoisten linkkien kampanjat ja määräämällä niistä seuraamuksia; lisäksi se integroi laadulliset kriteerit luottamuksen semanttiseen analyysiin, TrustRank- indeksiin, joka tutkii muun muassa käyttäjien käyttäytymistä.

Lähteet

(en) Sergey Brin ja Lawrence Page, " Anatomy of a Large-Scale Hypertextual Web Search Engine " , Stanfordin yliopisto ,1998( lue verkossa )
Dominique Cardon, " PageRankin hengessä: tutkimus Google-algoritmiin ", Réseaux , voi. 1, n o 177,2013, s. 63-95 ( DOI 10.3917 / res.177.0063 , lue verkossa )
Matteo Pasquinelli ( käännökset Clément Blachier, Victor Lockwood ja Xiaomeng Zuo), "Google PageRank: kone huomion arvostamiseksi ja hyödyntämiseksi" , julkaisussa Yves Citton, Huomiotalous: kapitalismin uusi horisontti? , Pariisi, La Découverte, kokoonpano " Yhteiskuntatieteet ",2014, 328 Sivumäärä ( ISBN 9782707178701 , luettu verkossa ) , s. 161-178
Henk van Ess ( kääntänyt hollannin hollanniksi Jean-Marc Delprato), Da Google Code , Montreuil, Pearson Education France,2011, 157 Sivumäärä ( ISBN 978-2-7440-2460-3 ja 2744024600 , lue verkossa )
Bruno-Bernard Simon: Hakusi Googlella , 2014.
Ohjattu henkilökohtaisen kiinnostuksen kohteena oleva verkkosivusto: PageRank .

Huomautuksia ja viitteitä

Huomautuksia

Googlen perustajien Larry Pagein keksimän tuotenimen antonomasis, joka koostuu englanninkielisistä sanoista page ("page") ja rank ("rank").

Viitteet

TIC Mag , " Maailman 10 rikkainta huipputekniikan miljardööriä vuonna 2016 - TIC Mag ", TIC Mag ,26. elokuuta 2016( luettu verkossa , kuultu 9. joulukuuta 2017 )
[PDF] Perron-Frobeniuksen lause , matematiikan yhdistämistä koskeva asiakirja, kirjoittanut B. Bekka, Rennesin yliopisto 1.
[PDF] Kuinka PageRank toimii? , PageRank -algoritmin matemaattinen selitys, kirjoittanut M. Eisermann, Université Grenoble 1.
Miten Google määrittää pistemäärän verkkosivulle .
" Kaikki mitä sinun tarvitsee tietää Google PageRankista "
Dominique Cardon, " PageRankin hengessä: tutkimus Google-algoritmiin ", Réseaux , voi. 1, n o 177,2013, s. 63-95 ( DOI 10.3917 / res.177.0063 , lue verkossa )
(in) Eugene Garfield, " Kehitys Science Citation Index " , International Microbiology , vol. 20,2007, s. 65-69 ( ISSN 1139-6709 , lue verkossa )
(in) Sergey Brin ja Lawrence Page, " anatomia laajamittaisen Hypertextual hakukoneen " , Stanford University ,1998( lue verkossa )
US 6 285 999 B1.
Patentin teksti on saatavilla Yhdysvaltain patenttiviraston ( USPTO ) verkkosivustolla .
Lisenssisopimus, muutettuna vuonna 2003, on saatavana tältä osoitteelta .
(Grant NSF - IRI-9411306-4).
“Hallituksella on tietyt oikeudet keksintöön. » Katso patentin teksti .
Temaattisen PageRank- määritelmä .
"Tästä lähtien, kun Google näkee attribuutin (rel =" nofollow ") hyperlinkeissä, nämä linkit eivät saa hyvitystä, kun sijoitamme verkkosivustoja hakutuloksissamme. Tämä ei ole kielteinen ääni sivustolle, johon kommentti lähetettiin. se on vain tapa varmistaa, että roskapostittajat eivät saa mitään hyötyä julkisten alueiden, kuten blogikommenttien, paluuviitteiden ja viittausluetteloiden, väärinkäytöstä ", lähde .
(in) Matt Cutts , " PageRank kuvanveiston " on MattCutts.com ,15. kesäkuuta 2009(käytetty 28. syyskuuta 2010 ) .
SEOLand (13. heinäkuuta 2010), [1] .
” Käytä ensisijaiset URL ” on google.com .
Benoît Epron ja Marcello Vitali-Rosati , digitaalisen aikakauden kustantaminen , Pariisi, La Découverte -versio,2018, 114 Sivumäärä ( ISBN 978-2-7071-9935-5 , luettu verkossa ) , s. 77
(in) Robert K. Merton , " Matteus Vaikutus Science: Palkkio of Science and Communication Järjestelmän katsotaan " , Science , vol. 159, n ° 3810,5. tammikuuta 1968, s. 56–63 ( ISSN 0036-8075 ja 1095-9203 , PMID 5634379 , DOI 10.1126 / science.159.3810.56 , luettu verkossa , käytetty 19. marraskuuta 2018 )
Bruno-Bernard Simon, Google-hakusi , Pariisi, Editions Klog,2014, 162 Sivumäärä ( ISBN 979-10-92272-01-7 ).

Ulkoiset linkit

Google-tekniikan yleiskatsaus hakukoneiden tekniikoista.
(en) Web PageRank -ennuste Markov-malleilla Michalis Vazirgiannis, Dimitris Drosos, Pierre Senellart, Akrivi Vlachou - Tutkimuspaperi