Semantic Web , tai web semanttinen , on jatkoa Web standardoi World Wide Web Consortium (W3C). Nämä standardit rohkaisevat standardoitujen tietomuotojen ja verkkoprotokollien käyttöä verkossa Resource Description Framework (RDF) -mallin perusteella.
Jotkut kutsuvat semanttista verkkoa nimellä Web 3.0.
W3C: n mukaan "Semanttinen Web tarjoaa mallin, jonka avulla tietoja voidaan jakaa ja käyttää uudelleen useiden sovellusten, yritysten ja käyttäjäryhmien kesken . " Tämän lauseen kehitti Tim Berners-Lee (verkon keksijä ja W3C: n johtaja), joka valvoo yhteisten semanttisen verkkotekniikoiden kehitystä. Hän määrittelee sen "tietojen verkoksi, jota koneet voivat käsitellä suoraan ja epäsuorasti käyttäjien auttamiseksi luomaan uutta tietoa" . Tämän saavuttamiseksi semanttinen verkko toteuttaa datan verkon joka koostuu tietojen linkittämisestä ja jäsentämisestä Internetissä yksinkertaisesti jo sisältämän tiedon käyttämiseksi.
Vaikka sen arvostelijat ovat kyseenalaistaneet sen toteutettavuuden, sen vetäjät väittävät, että teollisuuden , biologian ja humanististen tieteiden tutkijoiden sovellukset ovat jo osoittaneet tämän uuden käsitteen oikeellisuuden. Tim Berners-Leen alkuperäinen Scientific American -lehden vuonna 2001 julkaisema artikkeli kuvasi odotettua evoluutiota nykyisestä verkosta semanttiseen verkkoon, mutta sitä ei ole vielä tapahtunut. Vuonna 2006 Tim Berners-Lee ja hänen kollegansa sanoivat: ”Tämä yksinkertainen idea… on suurelta osin hyödyntämättä. "
Kognitiivisen tutkijan Allan Collinsin , kielitieteilijän Ross Quillianin (vuonna) ja psykologin Elizabeth Loftusin keksimä käsite "mallin semanttinen verkosto " otettiin käyttöön 1960-luvulla ja esiteltiin useissa julkaisuissa keinona edustaa jäsennettyä tietoa. Internetissä käytettynä tämä malli laajentaa ihmisen luettavien verkkosivujen hyperlinkkiverkostoa lisäämällä sivuille koneellisesti luettavia metatietoja . Tämä metatieto on linkitetty toisiinsa, jolloin agentit voivat käyttää verkkoa älykkäämmin ja suorittaa tehtäviä käyttäjien puolesta. Semanttinen verkko nähdään yhdyskäytävänä tietojen käyttämiseen eri sovellusten ja järjestelmien välillä. Sen sovelluksia on paljon julkaisuissa, blogeissa ja useilla muilla aloilla.
Tim Berners-Lee ilmaisi alun perin semanttisen verkon näkemyksen seuraavasti:
Minulla on unelma verkosta [jossa tietokoneet] pystyvät analysoimaan kaikki verkossa olevat tiedot - sisällön, linkit ja ihmisten ja tietokoneiden väliset tapahtumat. "Semanttista verkkoa", jonka pitäisi tehdä tämä mahdolliseksi, ei ole vielä syntynyt, mutta kun se tapahtuu, koneiden kanssa keskustelevat koneet hoitavat päivittäiset kaupan, byrokratian ja jokapäiväisen elämämme mekanismit. Ihmiset, joita ihmiset ovat mainostaneet ikuisesti, toteutuvat lopulta.
”Haaveilen verkosta [jossa tietokoneet] pystyvät analysoimaan kaikki verkossa olevat tiedot: sisällön, linkit ja ihmisten ja tietokoneiden väliset tapahtumat. "Semanttista verkkoa", jonka pitäisi tehdä tämä mahdolliseksi, ei ole vielä syntynyt, mutta kun se tapahtuu, päivittäinen kaupankäynti, hallinto ja jokapäiväinen elämämme käsitellään koneiden kanssa vuoropuhelussa muiden koneiden kanssa. "Älykkäät agentit", joita on pitkään mainostettu, toteutuisivat lopulta. "
Suurin osa W3C: n tarjoamista tekniikoista oli jo olemassa. Niitä käytetään erilaisissa yhteyksissä, erityisesti niissä, jotka liittyvät tietoihin, jotka kattavat rajoitetun ja määritellyn toimialueen, ja joissa tiedon jakaminen on yleinen välttämättömyys, kuten tieteellinen tutkimus tai tietojen vaihto organisaatioiden välillä. Lisäksi on syntynyt muita tekniikoita, joilla on samanlainen tarkoitus, kuten mikroformaatteja .
Semanttisen verkon päätarkoitus on ohjata verkon kehitystä, jotta välittäjätön käyttäjät voivat löytää, jakaa ja yhdistää tietoja helpommin. Ihmiset voivat käyttää verkkoa tehtäviin, kuten sanan Pariisi löytämiseen , varata kirja kirjastoon, etsiä karttaa ja varata kuljetuslippu. Kuitenkaan koneita ei voi suorittaa kaikki nämä tehtävät ilman ihmisen ohjausta, kuten web-sivut on tarkoitettu luettavaksi ensisijaisesti ihmisiä. Semanttisen verkon tavoitteena on tehdä sivuista indeksoitavia sekä ihmisille että koneille. Tämä mahdollistaisi tylsän ja toistuvan tiedonhakutyön suorittamisen automatisoidusti samalla, kun parannettaisiin ja yhdistettäisiin tietoja verkossa käyttäjille.
Semanttinen verkko, sellaisena kuin se alun perin oli tarkoitettu, on järjestelmä, jonka avulla koneet voivat "ymmärtää" ja vastata monimutkaisiin ihmisten pyyntöihin niiden merkityksen mukaan. Tällainen "ymmärtäminen" edellyttää, että asiaankuuluvat tietolähteet on jäsennelty semanttisesti etukäteen. Tämä koneiden käytettävissä oleva rakenne mahdollistaa paljon suuremman etsintäkapasiteetin kuin mikä on mahdollista yksinkertaisesti asiakirjojen Webin avulla. RDF: n käyttäminen näiden tietojen jäsentämiseen mahdollistaa koneen suorituskyvyn hyödyntämisen; heidän kykynsä käsitellä tietoja antaa mahdollisuuden tutkia näistä tiedoista saatuja tietoja uusien johtopäätösten tekemiseksi olemassa olevasta tiedosta. RDF: n avulla HTML-muodossa tuotetuista asiakirjoista tulee tietoja, jotka koneiden ja käyttäjien yhteisellä työllä tuottavat uutta tietoa.
Lausekkeita " semantiikka ", " metatiedot ", " ontologiat " ja "semanttinen verkko" käytetään usein epäjohdonmukaisesti. Erityisesti niitä käyttävät päivittäin tutkijat ja ammattilaiset, joiden terminologia kattaa laajan teknologia-, käsite- ja käyttöalueen. Lisäksi sen toteuttamiseksi harkittavien tekniikoiden ja semanttisen verkon liikkumisen välillä on sekaannusta. Gerberin, Barnardin ja Van der Merwen julkaisemassa artikkelissa piirretään semanttisen verkon maisema ja esitetään lyhyt yhteenveto asiaan liittyvistä termeistä ja mahdollistavista tekniikoista. Tim Berners-Leen ehdottamaa arkkitehtonista mallia käytetään perustana edustamaan nykyisten ja nousevien tekniikoiden tilaa.
Seuraavassa esimerkissä verkkosivun teksti "Paul Schuster syntyi Dresdenissä" merkitään liittämällä henkilö hänen syntymäpaikkaansa. Alla näkyvä HTML- koodin osa osoittaa, kuinka kuvataan minigrafiikka käyttämällä RDFa- syntaksia Schema.org- sanaston ja Wikidata- tunnisteen kanssa :
<div vocab="http://schema.org/" typeof="Person"> <span property="name">Paul Schuster</span> est né à <span property="birthPlace" typeof="Place" href="http://www.wikidata.org/entity/Q1731"> <span property="name">Dresde</span>. </span> </div>Tämä esimerkki määrittelee seuraavat viisi kolmoista ( in ), jotka näytetään kilpikonna- muodossa . Jokainen tripletti edustaa muodostetun kuvaajan reunaa: sen ensimmäinen elementti (aihe) on sen solmun nimi, josta reuna alkaa, toinen elementti (predikaatti) osoittaa reunan tyypin ja viimeinen (objekti) on joko kohdesolmun nimi tai kirjaimellinen arvo (teksti, numero jne.).
_:a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> . _:a <http://schema.org/name> "Paul Schuster" . _:a <http://schema.org/birthPlace> <http://www.wikidata.org/entity/Q1731> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/itemtype> <http://schema.org/Place> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/name> "Dresde" .Monet tietokoneen tiedostot voidaan enemmän tai vähemmän luokitella kahteen luokkaan: ihmisen luettavissa olevat asiakirjat ja koneella luettavat tiedot . Ihmiset voivat lukea asiakirjoja, kuten sähköposteja , raportteja tai esitteitä. Toisaalta kalentereihin, osoitekirjoihin, lukulistoihin tai laskentataulukoihin sisältyvät tiedot ovat luettavissa, jos käytät sovellusta, jonka avulla niitä voidaan lukea, hakea ja muuntaa eri tavoin.
Tällä hetkellä World Wide Web perustuu ensisijaisesti asiakirjoihin, jotka on kirjoitettu hypertekstikielikielellä (HTML) , ts. Merkintäkäytäntöön, jota käytetään koodaamaan tekstiä, johon on leimattu multimediaobjekteja, kuten kuvia. Ja interaktiivisia lomakkeita. Metatietotunnisteet tarjoavat menetelmän, jolla tietokoneet voivat luokitella verkkosivujen sisällön; esimerkiksi :
<meta name="keywords" content="computing, computer studies, computer" /> <meta name="description" content="Cheap widgets for sale" /> <meta name="author" content="John Doe" />HTML-koodilla ja näyttötyökalulla (joka voi olla verkkoselain tai muu "käyttäjäagentti" ) voit luoda ja näyttää sivun, joka näyttää myytävänä olevat tuotteet. Luettelosivun HTML-koodi voidaan tehdä yksinkertaisesti, asiakirja, joka sisältää lauseita, kuten "tämän asiakirjan otsikko on" Gadgets Supermarket "", mutta HTML-koodi ei pysty yksiselitteisesti ilmoittamaan, että esimerkiksi tuotenumero X586172 on taulukko jonka hinta on 199 dollaria , eikä se ole myöskään kulutustuote. HTML voi vain sanoa, että tekstialue "X586172" on sijoitettava lähelle "huonekaluja" ja "199 € " jne. Ei ole mitään tapaa sanoa, että "tämä on luettelosivu", tai edes sanoa, että "Huonekalut" on eräänlainen otsikko, tai edes tietää, että "199 € " on hinta. Ei ole mitään tapaa ilmaista, että nämä tiedot on linkitetty yhteen kuvaamaan erillistä kohdetta , joka eroaa muista samalla sivulla mahdollisesti olevista kohteista.
Semanttinen HTML viittaa HTML-tunnisteiden käyttöön lisätietojen lisäämiseksi asiakirjaan. Esimerkiksi delpoistettua sisältöä strikeosoittavan HTML-elementin käyttäminen pelkän yliviivatun tekstin näyttämisen sijaan ja vain sen muotoilun määrittäminen. Semanttinen HTML jättää asettelun selaimelle lisäämällä CSS-tyylitaulukoita . Mutta tämä käytäntö saavuttaa rajansa määriteltäessä esineiden, kuten myytävien esineiden, semantiikkaa.
Mikromuodot ovat myös epävirallisia pyrkimyksiä laajentaa HTML syntaksi kone voi lukea semanttisen markup olioita asiakirjassa kuten artikkeleita myytäväksi tai yhteystietojen (esim hCard ).
Semanttinen verkko tarjoaa erityisesti dataa varten suunnitellut kielet: RDF ( Resource Description Framework ), OWL ( Ontology Web Language ) ja XML ( eXtensible Markup Language ). HTML kuvaa asiakirjat ja niiden väliset linkit. RDF, OWL ja XML puolestaan voivat myös kuvata asioita, kuten ihmisiä, kokouksia tai lentokoneiden osia. Tim Berners-Leen mukaan ”RDF on datan mikä HTML on asiakirjoille. RDF: n avulla voit linkittää tiedot luokkaan. "
Nämä tekniikat yhdistetään tarjoamaan kuvauksia, jotka täydentävät tai korvaavat verkkodokumenttien sisältöä. Siten sisältö voi näkyä kuvailevana datana, joka on tallennettu tietokantoihin, joihin on pääsy verkossa, tai asiakirjoissa olevien tunnisteiden kautta ( HTML: n tai sen muunnoksen XHTML - XML HTML - kautta). Nämä tiedot voidaan sitten leikata XML: n kanssa tai julkaista joskus vain XML: nä, ulkoasun ja datan kanssa erikseen. Koneellisesti luettavien kuvausten avulla sisällönhallintaohjelmat voivat lisätä sisältöönsä merkitystä eli kuvata sisällön tietorakennetta. Tällä tavalla kone voi:
Tässä on esimerkki tagista, jota käytettäisiin ei-semanttisella verkkosivulla :
<item>cat</item>Samankaltaisten tietojen koodaaminen semanttiselle verkkosivulle voi näyttää tältä:
<item rdf:about="http://dbpedia.org/resource/Cat">Cat</item>Tim Berners-Lee ajaa liittyvän tietoverkon ( linkitetyt tiedot , englanniksi ) tai verkkotiedot ( ranskaksi ) syntymistä Giant Global Graphille , toisin kuin verkko on maailmanlaajuinen web-pohjainen HTML-sivu. Tim Berners-Lee olettaa, että jos aiemmin jaoimme asiakirjoja, niin tulevaisuudessa jaamme tietoja. Hänen vastauksensa kysymykseen "miten?" Perustuu kolmeen pilariin. Yksi, URL-osoitteen on osoitettava tietoihin. Kaksi, jokaisen, joka käyttää URL-osoitetta, pitäisi pystyä hakemaan tietoja. Kolmanneksi datassa olevien suhteiden on osoitettava muihin URL-osoitteisiin tietojen kanssa.
Tim Berners-Lee kuvasi semanttisen verkon osaksi Web 3.0: ta:
Ihmiset kysyvät jatkuvasti, mikä on Web 3.0. Luulen, että kun sinulla on skaalautuva vektorigrafiikka - kaikki aaltoileva, taittuva ja sumea - Web 2.0: lla ja pääsy semanttiseen verkkoon, joka on integroitu valtavaan tietotilaan, sinulla on pääsy uskomattomaan tietoresurssiin .
”Ihmiset kysyvät koko ajan, mikä on Web 3.0. Luulen, että kun sinulla on vektoripiirustusten päällekkäin - kaikki aalloissa ja utuisissa taitteissa -, jotka kuvaavat Web 2.0: ta ja pääsyn semanttiseen verkkoon upotettuna valtavaan tietotilaan, sinulla on pääsy uskomattomaan tietolähteeseen. "
"Semanttista verkkoa" käytetään joskus "Web 3.0": n synonyyminä, vaikka kunkin termin määritelmä vaihtelee. Kuten "Web 2.0", "Web 3.0" on neologismi ja muotisana . Web 2.0: ssa termin käytöstä keskustellaan niiden välillä, joiden mielestä se on markkinointitermi ilman todellista muutosta, ja niiden välillä, jotka ajattelevat tapahtuneen todellista kehitystä.
Joitakin semanttisen verkon haasteita ovat laajuus, epämääräisyys, epävarmuus, epäjohdonmukaisuus ja petos. Automatisoitujen päättelyjärjestelmien on vastattava kaikkiin näihin kysymyksiin, jotta voidaan täyttää semanttisen verkon lupaukset.
Tämä haasteiden luettelo on enemmän havainnollistava kuin tyhjentävä, koska siinä keskitytään semanttisen verkon toteuttamisen yhdistämislogiikan ja todistuskerroksen haasteisiin. Suurimman osan tässä mainituista tekniikoista on laajennettava OWL- kieltä ( Web Ontology Language ) esimerkiksi merkitsemään tietyn tiedon ehdollinen todennäköisyys. Tämä on aktiivinen tutkimusalue.
Semanttisen verkon standardointia valvoo W3C .
Ilmaisua "semanttinen verkko" käytetään usein tarkemmin määrittelemään muodot ja tekniikat, jotka mahdollistavat sen olemassaolon. Aiheeseen liittyvän tiedon kerääminen, jäsentäminen ja noutaminen tapahtuu tekniikoilla, jotka antavat muodollisen kuvauksen käsitteistä, termeistä ja suhteista tietyllä osa-alueella . Nämä tekniikat ovat W3C: n standardoimia ja sisältävät erityisesti:
Semantic Web Stack on esimerkki edustaa arkkitehtuurin Semanttisen Webin. Komponenttien toiminnot ja suhteet voidaan tiivistää seuraavasti:
Standardit tarvitaan edelleen toteuttamaan Semantic Web mennä läpi suositus prosessin W3C ( World Wide Web Consortium ) työryhmissä. Tämä tarkoittaa, että jokainen uusi suositus on tarkistettu julkisesti. Sitten W3C: n suosituksista, jotka hyväksytään laajalti, tulee luonnollisesti "semanttisen verkon" standardeja .
Tässä on luettelo standardeista ja tärkeimmistä suosituksista, joihin semanttinen verkko perustuu:
Tässä ovat nykyiset aktiiviset suositukset:
Toisaalta monia vaiheita "semanttisen verkon" toteuttamiseksi on vielä kuviteltava, selkiytettävä ja määriteltävä. Tim Berners-Lee , läpi hänen Semantic Web Stack , tiivistää nämä vaiheet läpi seuraavat kerrokset:
Odotettaessa kaikkien näiden kerrosten käyttöönottoa jo käytettävissä olevat tekniikat, kuten SPARQL , mahdollistavat jo yhteentoimivuuden tarjoamisen datan tarkemmalla tarkkuudella kuin verkkopalvelujen tarjoamat tiedot (W3C on lisäksi peruuttanut verkkopalvelujen standardoinnin). painopisteet ).
Joukko tietolähteitä, jotka jakavat tietonsa semanttisen verkkostandardin kanssa, on nimetty tietoverkoksi (tai englanniksi " Linked Open Data ") helpottamaan yleisön hyväksymistä. Dataverkko perustuu linkitettyihin tietotekniikoihin, jotka menevät päällekkäin jo laajasti käyttöön otettujen semanttisen verkon tekniikoiden kanssa. Linked Data on yksi tärkeimmistä käytettävien teknologioiden liikkeen " avoimen datan " in England , jonka tarkoituksena on jakaa massiivisesti julkisia tietoja tutkimuksen vauhdittamiseksi ja kauppaa. Jotkut pitävät semanttisen verkon syntymistä seuraavana teknisenä ja siten taloudellisena läpimurtona, jota he kutsuvat jo Web 3.0: ksi .
Tavoitteena on siis tulevaisuudessa parantaa verkon ja sen kautta yhdistettyjen resurssien saatavuutta ja hyödyllisyyttä , kuten:
Tärkeimmät kritiikat liittyvät semanttisen verkon täydelliseen tai jopa osittaiseen toteutettavuuteen. Cory Doctorow puhuu " metacrap " ( portmanteau muodostettu sanat metatiedot ja paska , voimme yrittää tuoda Ranskan valtaan "métamerde"), kritiikki, joka perustuu ihmisen käyttäytymisen sarkastiseen havaintoon. Ihmiset voivat esimerkiksi sisällyttää lois mikrotietoja verkkosivuille pettääkseen semanttisen verkon moottorit, jotka "naiivisti" luottavat kaiken datan oikeellisuuteen. Tämän ilmiön tiedetään pettävän hyvin: indeksointimoottorit, kuten Google , pyrkivät havaitsemaan tämäntyyppisen manipulaation. Peter Gärdenfors ja Timo Honkela (en) olivat huomanneet, että semanttisen verkkotekniikan logiikka kattaa vain murto-osan ilmiöistä, jotka vaikuttavat verkon semantiikkaan.
Vuonna 2001 Cory Doctorow laati luettelon seitsemästä oletettavasti ylitsepääsemättömästä esteestä metadatan saamiseksi riittävän luotettavaksi mahdollisen semanttisen verkon käyttämiseksi. Hänen mukaansa :
Se sisältää myös muita metatietojen vanhentumiseen liittyviä syitä:
Cory Doctorow päättelee, että tällaista järjestelmää koskeva tutkimus voi palauttaa vain vanhentunutta ja osittain tai kokonaan virheellistä tietoa.
Arkkitehtuuri, työkalut ja hyvin käsitteitä semanttisessa webissä on usein arvosteltu, vedoten että teknologioita tai prosessien ylläpitää tietojen laatua, lisättynä ihmisten ja siksi erehtyväinen, ei voi vielä toimia mittakaavassa. Web . Nämä rajat ovat kaikki uusia ongelmia, joita tutkimus yrittää parhaillaan ratkaista semanttisen verkon haasteiden kautta . Web Science (in) on nimi annamme "kuri", jonka tavoitteena on ratkaista uusia tieteellisiä ongelmia, jotka tuo Web. Semanttiset verkkotekniikat on kuitenkin otettu käyttöön tietojärjestelmien toteuttamiseen erikoistuneissa yhteisöissä, mutta lähinnä suljetuissa järjestelmissä (esimerkiksi intranetissä ), kuten yrityksissä tai kirjastoissa.
Semanttisen verkon innostusta voivat lieventää sellaiset näkökohdat kuin sensuurin epääminen ja halu suojata yksityisyyttä . Esimerkiksi tekstianalysaattorit voidaan tällä hetkellä helposti huijata käyttämään muita sanoja, metaforoja tai käyttämään kuvia sanojen sijaan. Hallitusten on huomattavasti helpompi visualisoida ja siten hallita tiedon luomista verkossa, jos siinä käytetään semanttista rakennetta, koska tietoja on sitten paljon helpompi tulkita ja mahdollisesti estää automaattisen järjestelmän avulla. Lisäksi asiaan otettiin esiin käyttämällä meta-tietoja, kuten FOAF tai paikannuksen sovellusliittymää (as) , jotka kyseenalaistavat nimettömyys World Wide Web . Nämä huolenaiheet tekevät henkilötietojen turvallisuudesta aktiivisen tutkimuksen aiheen, kuten Policy Aware Web -projektissa.
Toinen arvostelija puhuu sisällön luomiseen ja julkaisemiseen kuluvan ajan pidentymisestä johtuen tarpeesta tuottaa siitä kaksi versiota: yksi ihmisten katseluun ja toinen koneille. Monet web-sovellukset kohtaavat kuitenkin jo tämän ongelman luomalla luettavissa olevan muodon verkkoselaimelle tai RSS- lukijan , kuten blogin, pyynnöstä . Mikroformaattien kehittäminen oli reaktio tällaiseen kritiikkiin. Puolustuksessaan semanttinen verkko todennäköisesti vähentää tiedonhakutehtäviin liittyvää vaivaa ja korvaa siten yhteensopivan muodon toimittamisesta koneille aiheutuvat lisäkustannukset.
Yksi ensimmäisistä ratkaisuista oli käyttää GRDDL- kieltä , mekanismia, joka käyttää vain HTML-sivulla jo olevaa sisältöä (mahdollisesti mikroformaatteja) RDF: n purkamiseksi siitä. Mikroformaattien moninaisuus ja epävakaus samoin kuin XSLT- muuntimen luomisen vaikeus GRDDL: lle johti siihen, että RDFa määritettiin yksinkertaisesti ja nimenomaisesti integroimaan RDF HTML- sivuihin . RDFa-menetelmä integroidaan myös suoraan HTML5- standardiin mikrotietojen kautta , mikä yksinkertaistaa edelleen RDF-tietojen lisäämistä asiakirjaan.
Tässä osassa luetellaan joitakin semanttisen Web-liikkeen projekteista ja työkaluista.
Semanttisen verkon edistymistä ympäri maailmaa valvoo W3C osana Semantic Web Advanced Deployment ( SWAD ) -projektia. SWAD -Europe- projekti toteutettiinToukokuu 2002 klo lokakuu 2004.
Eurooppalainen organisaatio, joka isännöi W3C- projekteja ja seuraa semanttisen verkon etenemistä, on ERCIM ( European Research Consortium for Informatics and Mathematics ).
Ranskan kansalliskirjasto on siirtymässä semanttiseen verkkoon data.bnf.fr- projektinsa kautta . Tämä projekti integroi digitaaliselle kirjastolle eri muodoissa tuotetut tiedot, mukaan lukien Intermarc, XML-EAD ja Dublin Core . Tiedot mallinnetaan ja ryhmitellään automaattisella käsittelyllä ja julkaistaan useissa RDF- standardeissa : RDF-XML, RDF-N3 ja RDF-NT. Tiedot julkaistaan myös JSON: ssa . Projekti käyttää CubicWeb- semanttista kehitysalustaa .
Ranskan kansalliskirjasto tarjoaa näin:
Vuonna 2013 projekti jakoi Stanfordin palkinnon tutkimuksen kirjastojen innovaatioista (SPIRL) Gallican kanssa .
Vuodesta 2017 lähtien data.bnf.fr-tietomalli on perustunut IFLA LRM -konseptuaaliseen viitemalliin, jonka avulla se voi navigoida entiteettien välisissä suhteissa.
DBpedia on ensimmäinen historiallinen pyrkii julkaisemaan strukturoitua dataa poimittu Wikipedia : data erotetaan sivut ja erityisesti siitä Wikipediasta tietojen laatikot julkaistaan RDF ja asetetaan saataville WWW tietojen kautta HTTP ja SPARQL alle GFDL lisenssin. .
SemanticPedia on alusta tietojen julkaisemiseen erilaisista ranskankielisistä Wikimedia-projekteista, jota tukee kulttuuri- ja viestintäministeriö , Inria ja Wikimedia France . Ranskalainen versio DBpedia kehitti Wimmics joukkue alaisuudessa Fabien Gandon klo INRIA Sophia Antipolis tutkimuskeskuksessa. Tätä ranskankielistä lukua kutsutaan nimellä DBpedia.fr, ja se tukee ranskan kielen kansainvälistymistä DBpedia- aloitteessa, joka kerää ja julkaisee tietoja Wikipedian eri kielellisistä luvuista . Tämä DBpedian ranskalainen luku tukee monia sovelluksia. Ranskan kulttuuriministeri Aurélie Filippetti ilmoitti19. marraskuuta 2012 että seuraava projekti koskisi Wikisanakirjaa ja sen kahta miljoonaa termiä.
Wikidata on yksi Wikimedia Foundationin hankkeista. Sen tavoitteena on saattaa kaikki säätiön projektien strukturoidut tiedot vapaasti avustajien saataville ilman välittäjää.
Wikipedia on yksi Wikidataan liittyvistä hankkeista. Jokaisella Wikipedia-artikkelilla on nyt yksilöllinen tunniste IRI- muodossa ja se on kokonaisuus Wikidata-yhteisössä. Jokainen entiteetti koostuu useista ominaisuuksista, joilla on yksi tai useampi arvo (kolminkertainen). Nämä entiteetit ja ominaisuudet on merkitty yksilöllisellä tunnuksella (esimerkiksi: Q90 on Pariisin yksilöllinen tunniste), mikä tekee tietokannasta riippumattoman käytetystä kielestä. Näiden ominaisuuksien arvo voi olla toinen entiteetti, mutta myös merkkijono, numero, päivämäärä jne. Tällä tavoin strukturoitua dataa voidaan käyttää uudelleen eri muodoissa (XML, JSON, Turtle jne.), Ja sitä voidaan käyttää viime kädessä Wikipedian infoboxien syöttämiseen, jolloin vältetään muokkaamasta niitä manuaalisesti kaikilla kielillä, koska joka kerta Wikidataa muokataan ., kaikkia infolaatikoita muokataan samanaikaisesti.
Wikidata-tieto on lisensoitu CC0- lisenssillä . Siksi kaikki jaetut tiedot ovat ilmaisia ja avoimia kaiken tyyppiseen käyttöön.
Semanttista verkkoa varten Wikidata on yksi harvoista SPARQL- päätepisteistä, jotka on yhdistetty reaaliajassa datan tuottajiin. Tämä tarkoittaa, että Wikidatan muutokset vaikuttavat välittömästi RDF-tietokantaan ja mahdollistavat siten tietojen uudelleenkäytön muissa sovelluksissa SPARQL: n kautta. Rakenne ontologian suhteen rakentuu ajan myötä avustajien kesken yksimielisesti. Tämän ontologian rakenne voi siis muuttua milloin tahansa kirjoittajien tarpeiden mukaan.
AKSW ( Agile Knowledge Engineering ja Semantic Web ) on tutkimusryhmä, joka isännöi Betriebliche Informationssysteme ( BIS ) puheenjohtajaja Institut für Informatik ( IFI ) on yliopiston ja Leipzigin sekä joita Institute for Applied Computing ( INFAI ) . AKSW- tutkimusryhmäon käynnistänyt useita projekteja, kuten DBpedia.
Datalift on tietojen hyödyntämiseen tarkoitettu alkuperäinen alusta, joka integroi yhteen avoimen lähdekoodin ratkaisuun kaikki toiminnot, jotka ovat hyödyllisiä tietojen yhteenliittämiseen, niiden sieppauksesta lopulliseen julkaisemiseen. Dataliftissa lähtötiedot ovat heterogeenisistä muodoista (tietokannat, CSV, XML, RDF, RDFa, GML, Shapefile ...) tulevat raakatiedot. Tuotetut tiedot ovat linkitettyjä tietoja. Datalift-alusta osallistuu aktiivisesti tiedonsiirtoon verkosta verkkoon .
FOAF ( Friend Of a Friend ) on sanasto, joka käyttää RDF : ää kuvaamaan ihmisten suhteita muihin ihmisiin ja heidän ympärillään olevia "asioita". FOAF on esimerkki semanttisen verkon yrityksestä yrittää hyödyntää suhteita sosiaalisessa kontekstissa.
Semanttisesti toisiinsa linkitetyt verkkoyhteisöt (SIOC)SiOC on sanaston kuvata muita kohteita yleisesti käytetty yhteisön sivustoja ja niiden suhteita.
Tietoverkko tarjoaa uusia käyttötarkoituksia, jotka tekevät konkreettisen käsityksen kollektiivisesta älykkyydestä , kuten: