Skannaus on muuntaminen tietojen kannattimen (teksti, kuva, ääni, video) tai sähköisen signaalin sisään data digitaalinen laitteina tietokone tai digitaalinen elektroniikka voidaan käsitellä. Numeerinen data määritellään sarjaksi merkkejä ja numeroita, jotka edustavat tietoa. Käytetään joskus ranskalainen termi digitalisointi ( numeron merkitys kuva in Englanti ).
Skannaus yhteydessä arkistoon hallinnon, on massa muuntaminen tietokonetiedostojen asiakirjoja.
Digitointi rakentaa objektin erillisen esityksen muodossa rajallinen määrä merkkejä, jotka on otettu laskettavasta kelvollisesta merkkijoukosta.
tekstien digitalisointi:Tekstin digitalisointi on sen muuttuminen merkkisarjaksi, joka on otettu kirjoitetun kielen merkkiluettelosta, kun sanelu muuttaa puheen äänet kirjoitetun kielen sanakirjassa esiintyväksi sanasarjaksi.
skannaa kuvia:Kuvan digitalisointi muuttaa sen sarjaksi käskyjä, joiden avulla se voidaan rekonstruoida. Nämä ohjeet voivat koostua joukosta visuaalisia tuntemuksia jokaiselle elementille ( pikseli ) tai niillä voi olla monimutkaisempi organisaatio ( pakattu kuva , vektorigrafiikka ).
Ellei digitaalista dataa tuota suoraan ihminen (tätä kutsutaan tietojen syöttämiseksi ), digitalisointiin kuuluu tyypillisesti vähintään kolme vaihetta:
Nämä kolme vaihetta seuraavat usein monimutkaisempia toimintoja, jotka mahdollistavat tehokkaamman koodauksen. Tämä koskee erityisesti digitointia varten kuvia digitaalikameroiden ja digitoinnin tekstien ( DjVu muodossa , OCR ).
Joskus digitointiprosessi voi olla muussa muodossa.
lämpötilan skannaus dataloggerilla ( dataloggeri ):Lämpötila vaihtelee hitaasti ajan . Digitalisointi luo päiväkirjan sen evoluutiosta:
Joka kerta kun lämpötilan pyöristys muuttuu, uusi lämpötila sekä päivämäärä ja kellonaika kirjataan.
Tiedonkerääjä suorittaa nämä toiminnot automaattisesti muuttamalla ensin kaksi ulottuvuutta, lämpötilan ja ajan, sähköisiksi signaaleiksi . Se tallentaa tuloksen koodiin, jota muut tietokonelaitteet voivat hyödyntää.
Useimmissa tapauksissa kuitenkin säännöllisesti vaiheita käytetään sekä yksi määrät, jotka kuvaavat tavoitteena on mitattu mukaan kasvattamalla muiden. Saamme siis rajallisen määrän tietoa.
Toimintaa, jolla arvoa otetaan jokaiselle määrän lisäykselle, kutsutaan näytteeksi . Alueellisessa näytteenotossa diskretisoidaan pituutta pitkin , esimerkiksi ottamalla kirkkausarvo joka kymmenes millimetri kullekin tila- akselille . Ajallisessa näytteenotossa diskretisoimme ajan kulun esimerkiksi ottamalla arvon jokaisessa mikrosekunnissa.
Operaatiota, jonka arvo on pyöristetty toiselle, on otettu lopullisesta luettelosta, kutsutaan kvantisoinniksi .
Tämän digitalisoinnin tulos on sarja arvoja, jotka edustavat valittuja akseleita pitkin mitattua määrää tavanomaisessa järjestyksessä, mikä mahdollistaa kohteen jokaisen elementin kaikki mitat uudelleen.
Jotta digitalisoitu data edustaa alkuperäisiä määriä todenmukaisesti, on aina tehtävä oletuksia edustettavasta signaalista.
Kun tiedetään vain sen kaistanleveys ja signaali-kohinasuhde , informaatioteoria määrittää digitaalisen suorituskyvyn . Näytteenotto lause ehdotetaan vähintään näytteenottotaajuus kanssa kvantisointi siten, että kvantisointikohina on vastaavalle tasolle taustakohinan. Melu voidaan tehdä riippumaton signaalin dekorrelaation ( kiertelevät ) . Useat taajuuden ja kvantisointiasteikon yhdistelmät voivat kuvata riittävästi samaa signaalia.
Tarkemmin tiedettäessä edustettavat määrät voidaan käyttää vähemmän näytteitä pakattujen hankintamenetelmien ansiosta .
Jopa digitalisoinnin periaate merkitsee sitä, että käyttäjä (yleensä kone) tuntee käytänteet, jotka mahdollistavat edustetun kohteen uudelleenmuodostamisen. Näitä käytäntöjä kutsutaan datamuodoksi . Tietojen digitalisointi sisältää erottamattomasti
Kohde voidaan rekonstruoida vain, jos tietokoneessa on molemmat komponentit muistissa. Kun tiedostoa tai tietovirtaa vastaava algoritmi puuttuu koneelta, emme voi käyttää tietoja ja puhumme yhteensopivuusongelmasta .
Formaatit voivat olla hyvin yksinkertaisia, kuten yksiulotteisen signaalin digitalisoinnin raakavirrassa, jossa näytteet seuraavat toisiaan keskeytyksettä ja missä riittää tieto niiden koosta, numeerisesta koodauksesta ja nopeudesta. signaalin rekonstruoimiseksi tai monimutkaisempi, kuten asiakirjojen vektorikuvausmuotojen tapauksessa.
Tiedon pakkaustekniikat mahdollistavat tiedostojen koon tai suoratoiston nopeuden pienentämisen. Tällöin tiedon muuttumaton osa (muoto) kasvaa ja monimutkaistuu. Kun näiden tiedostojen tai virtojen edustama asiakirja on tarkoitettu jaettavaksi, etsitään sellaista muotoa, että kullakin asemalla suoritettava dekoodaus on vähemmän monimutkainen kuin koodaus, joka suoritetaan vain kerran.
Digitalisointiprosessit vaihtelevat digitoitavan tiedon fyysisen luonteen mukaan:
Ajan mukaan vaihtelevan määrän, kuten äänen, digitointi :
Kuvan digitoimiseksi korkeus ja leveys diskretisoidaan ja valotasot muunnetaan jokaiselle pisteelle joko globaalisti tai jokaiselle päävärille. Avaruusnäyte otetaan kolmella eri tavalla:
Nämä menettelyt koskevat mustavalkoista kopiointia. Värintoistoa varten arvot vaaditaan jokaiselle kolmelle päävärille. Joko jaamme kuvan valonsäteen kolmeen osaan, jotka vastaavat kolmea pääväriä, tai asetamme suodattimet jokaisen anturin eteen vaihtamalla värejä ja jatkamme interpoloimalla digitaalisen muunnoksen jälkeen arvioidaksemme kunkin värin pikseli. Yleensä muut prosessit kompensoivat raakakuvan puutteet.
Ajan myötä vaihtelevan kuvan digitalisointi yhdistää kaksi prosessiperhettä. Liikkuvan kuvan ( video ), digitaalikameran , digitaalisen videokameran , verkkokameran skannaaminen , näyteaika ja kuvan digitointi joka kerta (esimerkiksi kuvan kanssa 40 millisekunnin välein). Datavirta käy sitten läpi nopeuden alennusprosessin.
On myös mahdollista digitalisoida analoginen videosignaali joko tuottamalla raaka muunnos tälle sähköiselle signaalille tai rekonstruoimalla kaikki tai osa aikadiskretisointitiedoista pystysuuntaisista synkronointisignaaleista (kehyksistä) ja avaruudesta vaakasuuntaisista synkronointisignaaleista ( linjat).
Tekstin digitoimiseksi joko ihmisen käyttäjä syöttää tekstin , tai asiakirja digitalisoidaan kuvana soveltamalla tähän ensimmäiseen tietojoukkoon optista merkintunnistusohjelmaa, jota mahdollisesti täydennetään automaattisilla tai manuaalisilla tarkastuksilla.
Tietokonejärjestelmät mahdollistavat:
Digitaalisen datan lähetys, joka on käsitelty käytettävissä olevan spektrin maksimaalisen käyttöasteen saavuttamiseksi, vaatii vähemmän kaistanleveyttä siirtokanavissa kuin analoginen vastine.
Vastineeksi menetetyt tiedot menetetään tai menetetään digitalisoinnin aikana tai laskelmien tai uudelleenkoodaamisen aikana seuraaville käyttäjille.
Erikoiskomponentit varmistavat muuntimien alun perin tuottaman analogisen signaalin muuntamisen digitaaliseksi järjestelmäksi ( valoherkkä kenno , lämpömittari , mikrofoni , radiovastaanotin jne.).
A / D-muunnos ketju ( analoginen ja digitaalinen ) voidaan jakautuu toimintoja ja piirejä elementteihin:
Digitoinnin tarkkuus riippuu signaalin kvantisoinnin laadusta ja kellon vakaudesta.
Multiplekseri (MUX) voi muuttaa sekvenssin erillisiä signaaleja, analogisen tai digitaalisen, riippumaton signaalit, jotka saavuttavat sen rinnakkain (useita panoksia mutta vain yksi lähtö).
Monien digitalisointiprojektien seurauksena sähköisen sisällön arkistointi perustuu joukkoihin toimiin, työkaluihin ja menetelmiin, jotka on toteutettu elektronisen sisällön keräämiseksi, tunnistamiseksi, valitsemiseksi, luokittelemiseksi ja tallentamiseksi turvalliselle välineelle niiden käyttämiseksi. tehdä niistä saatavissa ajan myötä. Arkistointi on erotettava tallennuksesta ja varmuuskopioinnista .
Digitalisaation ja arkistoinnin yhdistävien hankkeiden tavoitteet ovat lukuisat. Aloilla sähköisten dokumenttien hallinta sekä tiedon ja kirjasto tieteet , ne täyttävät useita toimintoja:
Digitalisointi on yksi osa sitä, mitä joskus virheellisesti kutsutaan dematerialisaatioksi . Se on kiistatta yksi keskeisistä vaiheista kaikissa hankkeissa, joiden tavoitteena on optimoida saapuvien asiakirjojen ja postin hallinta. Yritykset ja viranomaiset vastaanottavat sitä edelleen laajalti paperimuodossa.
Sähköisen tiedon määrän räjähdys on väistämättä pakottanut organisaatioita harkitsemaan sähköistä sisältöä koko sen elinkaaren ajan, kunnes se arkistoidaan tai jopa tuhotaan.
Ranskan yritysten ja hallinnon täytyy myös integroida käsite koeajan kutsumuksen niiden arkistointia hankkeisiin, jotta todiste eheys ajan tiettyjen sähköisen sisällön aitoutta sen alkuperä (mukaisesti vaatimukset). Ovat säädökset tai esimerkiksi tiettyjä aloja tai toimialaa koskevilla asetuksilla). Sähköiset asiakirjat, joita etusijalla ovat koetarkoituksessa arkistointi, ovat siten laskuja, asiakkaita tai toimittajia, maksukuitteja tai sähköistä kirjeenvaihtoa.
Lukuisat toimet kulttuuriperinnön eri osien digitalisoimiseksi käynnistettiin 2000-luvulta lähtien kaikkialla maailmassa. Näiden joukossa on useita erittäin mittavia projekteja.
"Avoin sisältöliitto" (OCA)OCA-konsortio on amerikkalainen yhdistys, joka kokoaa yhteen yksityisiä yrityksiä, kuten Yahoo! , Adobe , HP , Internet-arkisto , kirjastot (BU California, BU Toronto), arkistot ja kustantajat. 25. lokakuuta 2005, Microsoft on liittynyt tähän ryhmään.
OCA: n tavoitteena on digitalisoida ja laittaa online-tietokanta kaikille saataville, monivuotinen ja monikielinen (multimedia-asiakirjoista koostuva tietokanta). Toisin kuin Google-teoshaku , siinä otetaan kuitenkin huomioon vain tekijänoikeudettomat perintörahastot . Digitointia ei tehdä ilman oikeuksien haltijoiden lupaa . Viimeksi mainitut voivat osallistua hankkeeseen määrittelemällä levityksen laajuuden mahdollisilla rajoituksilla.
Google-teoshakuIlmoitettu 14. joulukuuta 2004Google- yhtiön perustajien mukaan " Google Print " -ohjelma on vastuussa 15 miljoonan kirjan digitoinnista, mikä edustaa 4,5 miljardia sivua 6 vuodessa Ranskan kansalliskirjaston silloisen presidentin Jean-Noël Jeanneneyn mukaan . Viisi kirjastot ovat sopineet digitoida varansa: kirjastoissa Harvardin yliopiston , The University of Michiganin ja Stanfordin yliopiston , The New York Public Library ja Bodleian Library of Oxford University . Google Print käynnistettiin virallisesti marraskuussa 2005, ja siellä oli kokoelma digitaalisia kirjoja julkisesti ja hankekumppaneilta. Sen nimi muutettiin marraskuun puolivälissä "Google-kirjojen hauksi" ("Google-teoshaku" ranskaksi). Googlen ja muiden yliopistojen välillä on tehty uusia sopimuksia tämän digitaalisen kirjaston rikastamiseksi.
Euroopan digitaalikirjasto22. tammikuuta 2005, Presidentti Ranskan kansalliskirjasto , Jean-Noël Jeanneney , veneet päivittäin Le Monde valituksen reagoida aloitteesta Google. Huhtikuun 2005 lopussa 19 maan kansalliskirjastot, sitten kuusi Euroopan valtion- ja hallitusten päämiestä, vaativat eurooppalaista yhteistyötä eurooppalaisen digitaalisen kirjaston ( Europeana ) luomiseksi . Vuotta myöhemmin avautuu BNE: n monikielinen portaali The European Library .
Vuonna 2016 Europeana tarjoaa pääsyn 53 miljoonaan digitoituun asiakirjaan 3300 eurooppalaisesta laitoksesta. Seuraavana vuonna Euroopan komission tilaama tutkimus osoittaa, että Europeana- asiantuntijaa kuullaan 700 000 kertaa kuukaudessa.