Internet-arkisto | |
Peilipaikan palvelimia säilytetään Bibliotheca Alexandrinassa | |
Luominen | 1996 |
---|---|
Perustajat | Katso hallitus |
Juridinen lomake | Voittoa tavoittelematon organisaatio |
Iskulause | Yleinen pääsy kaikkeen tietoon |
Pääkonttori | 300 Funston Avenue, Richmondin alue , San Francisco , Kalifornia USA |
Suunta | Julien masanes |
Toiminta | Verkkoarkistointi ja säilyttäminen |
Tuotteet | Kansitaiteen arkisto ( d ) |
Kumppanit | Amerikan digitaalinen julkinen kirjasto |
Tehokas | 200 |
Verkkosivusto | archive.org |
Liikevaihto | 14 000 000 Yhdysvaltain dollaria (2015) |
Internet Archive (tai IA ) on voittoa tavoittelematon järjestö omistettu web arkistointiin , joka toimii myös digitaalinen kirjasto . Nämä sähköiset arkistot koostuvat otoksista (kopiot eri aikoina otetuista sivuista) verkkosivuista, ohjelmistoista, elokuvista, kirjoista ja äänitallenteista.
Vakauden turvaamiseksi ja turvallisuuden arkistoitua dataa , joka on toimiva peili sivusto ylläpidetään Alexandrian kirjaston vuonna Egyptissä . Tekoäly tarjoaa kokoelmansa tutkijoiden, historioitsijoiden ja tutkijoiden saataville ilmaiseksi. Se sijaitsee Richmondin alueella San Franciscon Presidion eteläpuolella. Se on American Library Associationin jäsen ja Kalifornian osavaltio on virallisesti tunnustanut sen kirjastoksi .
Web crawler käyttämä IA on heritrix , ilmainen ohjelmisto . Ilmainen kirjojen skannausohjelma on Scribe.
Internet Archive perustettiin vuonna 1996 , jonka Brewster Kahle . IA: n perustajat pyrkivät tavoitteidensa - inhimillisen tiedon säilyttämisen ja kokoelmien saatavuuden kaikkien - takia vertailemaan tätä projektia Aleksandrian kirjaston vanhempaan .
Wayback Kone on tilannekuvan osa Web kehittämä Internet Archive . Brewster Kahle loi Wayback Machine -palvelun kaikkeen verkossa tallentamiseen ja indeksointiin. Wayback Machine päivitetään Alexan sisällöllä . Tämän palvelun avulla käyttäjät voivat nähdä verkkosivujen arkistoidut versiot ajan myötä: se on "kolmiulotteinen hakemisto".
Yksittäiskuvat ovat käytettävissä kuusi - kaksitoista kuukautta kaappauksen jälkeen. Yksittäiskuvien taajuus vaihtelee, kaikkia verkkosivuston päivityksiä ei tallenneta, ja useiden viikkojen välejä voidaan havaita.
Vuonna 2006 Wayback Machine sisälsi melkein kaksi petatavua tietoa. Määrä kasvaa nopeudella 20 teratavua kuukaudessa, mikä on kaksi kolmasosaa enemmän kuin 12 teratavua kuukaudessa, joka oli kasvuvauhti vuonna 2003. Tämä kasvu on suurempi kuin tekstin määrä tärkeimmissä kirjastoissa. mukaan lukien kongressin kirjasto . Vuonna 2009 Wayback Machine sisälsi melkein kolme petatavua tietoa ja sen kasvu oli 100 teratavua kuukaudessa. Tiedot arkistoidaan Capricorne Technologiesin Petabox-telineiden valmistamissa järjestelmissä.
Nimi " Wayback Machine " tarkoittaa jaksoja Rocky ja Bullwinkle Show , jossa herra Peabody, professorin koira ja hänen avustajansa Sherman (ihmisen PET), käytä aikaa koneen nimeltään ”WABAC Machine” kuvaamaan kuuluisia historiallisia tapahtumia.
Vuonna 2015 Venäjä olisi vahingossa estänyt koko Wayback Machine -sivuston .
Käyttäjiä, jotka haluavat arkistoida tietonsa pysyvästi ja välittömästi, voidaan käyttää tilauksessa, palvelussa Archive-It (en) IA. Wayback Machine indeksoi kerätyt tiedot säännöllisin väliajoin . Sisäänjoulukuu 2007, tämä palvelu oli luonut yli 230 miljoonaa URL- osoitetta 466 julkiselle kokoelmalle, mukaan lukien valtion virastot, yliopistot ja kulttuurilaitokset.
Esimerkki organisaatioista tai laitoksista, jotka osallistuvat Archive-It: iin:
Verkkoarkistojen lisäksi Internet-arkistopalvelut ylläpitävät suuria digitaalisen median kokoelmia, jotka ovat joko julkisessa omistuksessa tai jotka on lisensoitu edelleenjakelua varten, kuten Creative Commons -lisenssit . Mediat on järjestetty kokoelmiin tyypin mukaan (liikkuvat kuvat, ääni, teksti jne.) Ja alakokoelmiin eri kriteerien mukaan. Jokainen pääkokoelma sisältää yhteisön alakokoelman , johon voidaan arkistoida suuren yleisön julkaisuja.
Sen kokoelmiin kuuluu (alkaen 14. marraskuuta 2007):
Elokuva-elokuvien lisäksi Internet-arkiston videokokoelma sisältää uutisia, sarjakuvalehtiä , pro- ja sodanvastaista propagandaa sekä enemmän lyhytaikaista materiaalia Prelinger-arkistosta, kuten mainokset, koulutus- ja teollisuuselokuvat sekä amatöörielokuvakokoelmat.
Esimerkkejä kokoelmasta:
Esimerkki ranskalaisesta elokuvasta:
Äänikokoelma koostuu musiikista, äänikirjoista, uutislähetyksistä, vanhoista radio-ohjelmista ja monista muista äänitiedostoista. Elävää musiikkia Archive Saharan kokoelma sisältää 40000 tallenteet konsertteja riippumattomia taiteilijoita sekä enemmän artistien ja musiikkiesityksiä vähemmän tiukkoja sääntöjä tallennus konsertteja kuten Grateful Dead .
TekstitTämä kokoelma kokoaa yhteen Gutenberg-projektin tekstejä, tekstejä eri kirjastoista ympäri maailmaa sekä kokoelman asiakirjoja ja muistiinpanoja ARPANETista . Internet-arkisto, jolla on yli 7 miljoonaa kirjaa, on maailman toiseksi suurin avoimen digitaalisen kirjaston kirjasto Google-kirjojen jälkeen. Kaikki asiakirjat, jotka internetin käyttäjät tai instituutiot ovat digitoineet ja laittaneet verkkoon, muunnetaan EPUB-tiedostoiksi sähköisille lukijoille tai MOBI Kindle: lle, ja niitä voi arkistoida useilla palvelimilla ympäri maailmaa (Kalifornia, Egypti, Kiina, Alankomaat). ).
Sainte-Geneviève kirjasto on ensimmäinen Ranskan kirjaston osallistua hankkeenmaaliskuu 2010. Ranskassa École des Ponts ParisTech (vuodesta 2003)Elokuu 2012), kansallinen maatalouden tutkimuslaitos (vuodesta 2002) tammikuu 2015), Sciences Po Paris (vuodesta kesäkuu 2015), yliopistojen välinen terveyskirjasto (vuodesta 2001) tammikuu 2018), yliopiston kieli- ja sivilisaatiokirjasto (syyskuusta 2019 lähtien) ja École normale supérieure -kirjastot (joulukuusta 2020 lähtien) ovat myös mukana.
Internet-arkisto on Open Content Alliancen jäsen (sisällä) ja ylläpitää avointa kirjastoa, jossa yli 200 000 julkisesti saatavana olevaa digitoitua kirjaa on saatavana verkossa ja tulostettavissa. Scribe Book Scanning System palvelee tätä tarkoitusta.
Koronaviruspandemian aikana Internet-arkisto asettaa tekijänoikeuksin suojatut kirjat amerikkalaisten saataville, jotta he voivat opiskella synnytyksen aikana. Useat kustantajat ovat eri mieltä, ja Internet-arkisto peruuttaa pääsyn kyseisiin kirjoihin16. kesäkuuta 2020. Kaikesta huolimatta kustantajat haastavat sivuston ja oikeudenkäynti on suunniteltu vuodelle 2021.
Vuoden 2002 lopussa Internet-arkisto pyyhkäisi useita Wayback-koneen tunnistamia scientologiaa kritisoivia sivustoja . Virhesanomassa todetaan, että se johtui "sivuston omistajan pyynnöstä". Myöhemmin selvitettiin, että scientologisen kirkon lakimiehet olivat vaatineet poistamista ilman oikeudellista syytä ja että näiden sivustojen omistajat eivät halunneet heidän sivujensa poistamista.
Sisään lokakuu 2004Asiassa nimeltä " Telewizja Polska SA vs Echostar Satellite " asianajaja yrittää käyttää Wayback-koneen arkistoja hyväksyttävien todisteiden lähteenä, todennäköisesti ensimmäistä kertaa.
Telewizja Polska on toimittaja TVP Polonia ja Echostar käyttöä lautasen verkkoon . Ennen oikeudenkäyntiä EchoStar kertoi aikovansa käyttää Wayback-koneen tilannekuvia todisteena Telewizja Polska -sivuston aikaisemmasta sisällöstä. Telewizja Polska jätti limine (in) -hakemuksen poistaakseen perustelijoiden laukaukset kuulosta ja luvattomasta lähteestä, mutta tuomari Arlander Keys hylkäsi Telewizja Polskan vaatimukset ja kieltäytyi jättämästä todisteita pois oikeudenkäynnissä. Oikeudenkäynnin ajankohtana käräjäoikeuden tuomari Ronald Guzman kumosi ensimmäisessä oikeusasteessa tuomari Keysin havainnot ja päätyi siihen, että Internet-arkistoa tai sen taustalla olevia sivuja (ts. Telewizja Polska -sivustoa) ei voitu hyväksyä todisteina. Tuomari Guzman katsoi, että verkkosivun tulostaminen ei ollut todiste tietojen todentamisesta.
Healthcare Advocates, Inc.Vuonna 2003 Healthcare Advocates, Inc. -yhtiötä syytettiin tavaramerkkirikkomusoikeudenkäynnistä. Syyttäjä yritti käyttää arkistoitua Internet-aineistoa, johon pääsi Internet-arkiston kautta. Menetettyään tämän oikeusjutun yritys yritti haastaa Internet-arkiston DMCA: n ja tietokonepetoksia ja väärinkäytöksiä koskevan lain rikkomisesta . He väittivät, että koska he asentivat robots.txt- tiedoston verkkosivustolleen, tekoälyn botin olisi pitänyt välttää sitä. Ensimmäinen valitus tehtiin26. kesäkuuta 2003, ja he lisäsivät robots.txt-tiedoston, 8. heinäkuuta 2003, sivut peruutetaan taannehtivasti. Oikeudenkäynti ratkaistiin tuomioistuimen ulkopuolella.
Robots.txt käytetään osana robotin rajausstandardi , vapaaehtoinen standardi, IA pätee joka kieltää indeksoimasta tiettyjä sivuja merkitty luoja kielletyiksi alueiksi. Tämän seurauksena tekoäly on poistanut joukon verkkosivustoja, joihin ei ole nyt pääsyä Wayback Machine -palvelun kautta. Tämä johtuu joskus uudesta omistajasta, joka sijoitti robots.txt-tiedoston, joka kieltää sivuston indeksoinnin. Järjestelmänvalvojat sanovat työskentelevänsä järjestelmässä, joka sallii pääsyn aiempiin arkistoihin sulkemalla pois tiedostojen lisäämisen jälkeen luodut kohteet.
Vuonna 2006 IA sovelsi Robots.txt-sääntöä taannehtivasti. Jos sivusto estää IA: n, kuten Healthcare Advocates, myös kaikki kyseisestä verkkotunnuksesta aiemmin arkistoidut sivut poistetaan. Estettyjen sivustojen tapauksessa vain robots.txt-tiedosto arkistoidaan. Tämä käytäntö näyttää olevan haitallista tutkijoille, jotka saavat aikaisemmin saatavilla olevaa tietoa.
IA toteaa kuitenkin myös, että "joskus verkkosivuston omistaja ottaa meihin yhteyttä suoraan ja pyytää meitä lopettamaan sivuston indeksoinnin tai arkistoinnin. Noudatamme näitä pyyntöjä. He selittivät myös, että "Internet-arkisto ei ole kiinnostunut säilyttämään tai tarjoamaan pääsyä verkkosivustoille tai muulle Internet-aineistolle, jonka omistavat ihmiset, jotka eivät halua heidän arkistoitavan . "
PatenttilakiYhdysvaltain patenttivirasto ja soveltaa lisävaatimuksia täyttyvät (esim tarjota virallisen ilmoituksen arkistonhoitaja), The Euroopan patenttivirasto hyväksyy vuodelta Internet Archive todisteena julkaisemisen web-sivulla. Näitä päivämääriä käytetään määrittämään, onko verkkosivu käytettävissä ennen esimerkiksi patenttihakemuksen jättöpäivää.
Sisään marraskuu 2005, Grateful Dead -konserttien ilmainen lataus on poistettu sivustolta. John Perry Barlow tunnisti Bob Weirin , Mickey Hartin ja Bill Kreutzmannin tämän muutoksen käynnistäjiksi. 30. marraskuuta, Brewster Kahlen foorumilla julkaistu viesti tiivistää yhtyeen jäsenten välisen kompromissin. Live- konsertteja voi ladata tai kuunnella, ja äänitteet ovat vain kuunneltavissa. Konsertit on sittemmin lisätty.
Suzanne Shell12. joulukuuta 2005, aktivisti Suzanne Shell (vuonna) vaati 100 000 dollarin summaa sivustonsa "profane-justice.org" arkistoimisesta vuosina 1999-2004.20. tammikuuta 2006, Internet-arkisto nosti julistavan tuomion Pohjois-Kalifornian piirissä ja pyysi tuomioistuinta toteamaan, että IA ei loukannut Shellin tekijänoikeuksia.
Shell vastasi ja teki uuden valituksen IA: ta vastaan sivuston arkistoinnista, väittäen sen käyttöehtojen rikkomista. 13. helmikuuta 2007, Coloradon piirituomari hylkäsi kaikki vaatimukset paitsi sopimusrikkomusta.
25. huhtikuuta 2007, IA ja Shell ovat yhdessä ilmoittaneet riidan ratkaisemisesta. IA sanoi: "Internet-arkistolla ei ole kiinnostusta laittaa tietoja Wayback-koneeseen ihmisistä, jotka eivät halua nähdä arkistoitua verkkosisältöään. Tunnustamme, että M me Shellillä on voimassa oleva tekijänoikeus ja joka on sovellettavissa sen sivustolle, ja pahoittelemme, että sen sivuston rekisteröinti Wayback Machine -laitteeseen on johtanut tähän oikeudenkäyntiin. Olemme iloisia, että tämä tapaus on takanamme. " Shell sanoi: " Kunnioitan Internet-arkiston tavoitetta ja historiallista arvoa. En koskaan aikonut puuttua tähän tavoitteeseen tai aiheuttaa vahinkoa. "
Tekijänoikeustilanne EuroopassaEuroopassa Wayback Machine voi joskus rikkoa tekijänoikeuslakia. Vain luoja voi päättää, missä sen sisältö julkaistaan tai toistetaan. Sivut tulisi poistaa arkistosta luojan pyynnöstä.
Euroopassa Euroopan Internet-arkisto on kilpailija.