Kemometria

Kemometria
Alaluokka Kemia , tilastot , koneoppiminen

Kemometria on sovellus matemaattisia työkaluja, erityisesti tilastoja , saada mahdollisimman paljon tietoa kemiallisista tiedoista.

Kemometria on hyvin sovellettu ala . Sen tavoitteena on parantaa prosessien hallintaa ja optimointia sekä valmistettujen tuotteiden laatua. Sen kehittymistä on kiihdyttänyt huomattavasti analyyttisen kemian laboratorioiden lähellä oleva infrapunaspektrometria .

Kemometriikka eroaa tilastoista siinä, että:

Kemometriikkaa ovat erityisesti:

Kokeellisten suunnitelmien tarkoituksena on järjestää matemaattisesti koeolosuhteet informatiivisimpien valitsemiseksi, mikä mahdollistaa kokeiden määrän minimoinnin ja maksimoimalla saadut tiedot.

Tutkittuja tietoja

Yksi kemometrian pääalueista on infrapunaspektroskopia  : lähi- ja keskipitkän infrapuna ( PIR / MIR ) erilaisissa lähestymistavoissa (moni- / hyperspektrinen, spatiaalinen tai ei). Mutta voidaan tutkia myös muita tietoja: NMR-spektroskopia , massaspektroskopia , Raman-spektroskopia .

Kemometrialla käsitellyillä signaaleilla on yleensä yhteistä, että kukin muuttuja (kukin intensiteetti tietyllä aallonpituudella) ei ole kovin herkkä tutkitulle ilmiölle, mutta kaikki muuttujat voivat olla. Kemometria koostuu sitten lineaaristen algebraoperaatioiden kautta signaalimuuttujien yhdistämisestä, jotka eivät ole kovin herkkiä, uusien herkkien muuttujien, latenttien muuttujien, luomiseksi.

Yleiset menetelmät ja hyvät käytännöt

Merkinnät

Matriisien tulee edustaa rohkeita isoilla kirjaimilla, kuten X . Vektorit pienillä kirjaimilla lihavoituna, kuten x j, joka edustaa X: n j: tä kolmatta saraketta , ja skalaarit, pienillä kirjaimilla, kuten n, joka osoittaa yksilöiden lukumäärän tai p osoittaa muuttujien lukumäärän. Tiedot sisältävät signaalit ovat kuvanneet s muuttujat mitataan n yksilöiden tallennetaan matriisiin X on n riviä ja s saraketta.

Oppiminen

Suurella määrällä kemometrisiä menetelmiä pyritään suorittamaan kalibrointi signaalin x (esimerkiksi spektri) ja ennustettavien määrien y (esimerkiksi pitoisuus ja tiheys) välillä oppimisen avulla. Oppimisessa, on toivottavaa rakentaa matemaattinen malli joukko näytteitä, joista se on mitattu x ja y , jotka on ryhmitelty kahteen matriisit, X ja Y . Tätä varten tiedot jaetaan klassisesti kolmeen ryhmään: harjoitusjoukko ( X c, Y c), validointijoukko ( X v, Y v) ja testijoukko ( X t, Y t).

Mallin rakentamisessa on kaksi vaihetta.

  1. Mallin ( hyper ) parametrien optimointivaihe (signaalin esikäsittely, kNN: n lähimpien naapureiden lukumäärä, piilevien muuttujien määrä PLS: ssä jne.). Malli lasketaan X c: lle, Y c: lle annetuilla parametriarvoilla ja malli testataan sitten X v: llä, Y v: llä. Näiden testien tuloksia käytetään mallin parametrien säätämiseen.
  2. Mallin arviointivaihe. Malli parametrien avulla määritetään optimointia vaiheessa lasketaan ( X c + X v, Y c + Y v) ja testattiin X t, Y t.

Vaihe 1 lainaa tyypillisesti ristivalidoinnin , jossa kalibrointisarjaa ja vahvistusjoukkoa vedetään toistuvasti. Ristivahvistuksia on useita: satunnaisia ​​lohkoja , jack-veitsi , sälekaihtimet , jätä yksi ulos , toistuva ... Jätä yksi ulos -ohjelmaa ei suositella, koska se edistää ylioppimista. Toistuva ristivalidointi on suositeltavaa.

Mallin rakentamisen aikana on kiinnitettävä suurta huomiota siihen, ettei sen suorituskriteereitä keinotekoisesti vääristetä. Esimerkiksi saman näytteen kaikkia mittauskopioita ei saa koskaan erottaa kalibrointisarjasta ja validointijoukosta, ja testijoukon tulisi olla mahdollisimman riippumaton ja edustava mallin tulevaa käyttöä.

Kaavio esittää logiikkakaavion, joka on tyypillinen kalibrointimallin rakenteelle kemometriikassa.

Mallin suorituskyky ja arviointikriteerit

Suorituskyvyn arvioinnissa käytetyt kriteerit: RMSEP, R2 (ja / tai R2: een liitetty RPD).

Laadun arvioinnissa käytetyt kriteerit: Durbin-Watson-kerroin, Hotelingin T2-, Q-kerroin.

Käytetyt tekniikat ja menetelmät

Tietojen esikäsittely

Ennen käsittelyä tutkimus- tai kalibrointimenetelmillä data on joskus esikäsiteltävä, jotta voidaan poistaa ei-toivotut taustasignaalit, kuten esimerkiksi peiliheijastusten vaikutukset spektroskopiassa. Monia esikäsittelymenetelmiä on kuviteltu ja kehitetty sekä yleisten muutosten, kuten esimerkiksi monistavien tai additiivisten vaikutusten, eliminoimiseksi että kullekin analyyttiselle tekniikalle ominaisten ongelmien ratkaisemiseksi, kuten esimerkiksi fluoresenssi Raman-spektrometriassa.

Esikäsittelyt jakautuvat kahteen laajaan luokkaan: esikäsittelyt, jotka perustuvat tietokannassa oleviin yksilöihin (ts. Matriisin sarakkeisiin) laskettuihin tilastoihin ja esikäsittelyt, jotka perustuvat kunkin yksilön signaalinkäsittelyyn (ts. Matriisin riveihin).

Saraketilastoihin perustuvat esikäsittelyt

Kemometriikka perustuu pääasiassa tilastollisiin laskelmiin, kuten keskiarvo, varianssi, kovarianssi jne. Nämä määrät kuvaavat yksilöiden joukkoa, jolle malli rakennetaan. Esimerkiksi PLS pyrkii maksimoimaan kovarianssin. Muuttujien mittaamiseen käytetyillä yksiköillä voi kuitenkin olla asteikko, jota ei voida verrata. Samoin joidenkin muuttujien jakauma voi olla hyvin vinossa, mikä johtaa ennakkoarvoon tilastollisista hetkistä. Näiden vääristymien korjaamiseen käytetään tietty määrä esikäsittelyjä. Saraketilastoihin perustuvat esikäsittelyt lasketaan yksilöiden avaruudessa ja käytetään sitten kullekin yksilölle, jota malli testaa. Siksi niitä ei tule suorittaa ennen kalibrointi- / testikokoonpanon jakamista. Erityistä huomiota tulisi kiinnittää myös ristivalidoinnin aikana. Esikäsittely on todellakin "integroitava" ristivalidointisilmukkaan sen laskemiseksi ja soveltamiseksi ristiinvahvistuksen kuhunkin iteraatioon.

Yleisimpiä menetelmiä muuttujien jakauman korjaamiseksi on vähentää ja / tai jakaa kukin sarake kyseiselle sarakkeelle lasketulla tilastolla.

Pylvään keskitys

Sarakekohtaisen keskityksen tarkoituksena on määritellä alkuperä, jonka kautta malli kulkee. Yksityiskohtainen kuvaus eri keskitystavoista löytyy Bro- ja Smilde-sivuilta. Yleisimmin jokaisen datasarakkeen keskiarvo vähennetään kyseisen sarakkeen kaikista arvoista, jolloin saadaan datamatriisi, jossa kunkin esikäsitelty muuttujan keskiarvo on nolla. Kun näille esikäsitellyille tiedoille laskettua mallia sovelletaan uuteen yksilöön, tälle yksilölle on välttämätöntä soveltaa samaa keskitystä kuin esikäsittelyssä käytettyä, eli vähennetään tältä yksilöltä pelin keskiarvo. .

Standardointi sarakkeittain

Sarakkeiden normalisoinnin tarkoituksena on tasapainottaa kaikkien sarakkeiden tilastopainot. Tämä tarkoittaa sarakkeiden muuttamista ulottuvuuksiksi. Tätä varten on olemassa erilaisia ​​menetelmiä. Yleisintä on antaa kaikille sarakkeille sama varianssi jakamalla ne keskihajonnalla keskittämisen jälkeen. Tämä tarkoittaa, että ainoa jäljellä oleva tieto liittyy muuttujien välisiin korrelaatioihin. Tätä toimintoa kutsutaan myös pienennykseksi tai automaattiseksi skaalaukseksi . Pareto-skaalauksessa voidaan käyttää muita tilastoja kuin keskihajontaa, esimerkiksi keskihajonnan neliöjuuria.

Hyvin harvoin käytetään lähellä infrapunaspektrometriaa, automaattinen skaalaus on erittäin hyödyllistä, kun tietoa kantavat signaalit ovat heikkoja eikä korreloi muiden voimakkaampien signaalien kanssa. Näitä tapauksia voi esiintyä esimerkiksi massaspektrometrisignaaleilla .

Signaalinkäsittelyyn perustuva esikäsittely

Signaalinkäsittelymenetelmiä käytetään laajalti spektroskooppisissa sovelluksissa spektritietojen korjaamiseksi koon vaikutuksille ja keskitytään signaalin muotoon. Toisin kuin saraketilastoihin perustuvat menetelmät, signaaliin perustuvia esikäsittelyjä sovelletaan kullekin yksilölle muista riippumatta. Siksi ne voidaan yleensä suorittaa ennen kalibrointi- ja testisarjojen jakamista, eivätkä ne vaadi varotoimia ristivalidoinnissa .

Perusviivojen korjaus

Spektrit voivat sisältää jäsenneltyjä taustasignaaleja, joihin viitataan yleensä perusviivoina. Perusviivojen on tarkoitus olla jatkuvia, matalataajuisia signaaleja, jotka lisäävät mitattuun signaaliin. Perusmalleja on erilaisia: vakio, lineaarinen, polynomi jne. mikä johti erilaisiin korjausmenetelmiin. Lisäksi tietyt signaalinkäsittelysuodattimet on sovitettu kemometristen spektrien esikäsittelyyn. Joten menetelmiä on paljon, parhaan valitseminen riippuu suuresti sovelluksesta.

Yleisimmät lähtötilanteen korjausmenetelmät ovat:

  • vähennetään arvo koko spektristä. Esimerkiksi vähentämällä vähimmäismäärä, esikäsitellyn spektrin minimiarvo on 0. Tätä menetelmää ei suositella, koska se käyttää yhden pisteen arvoa ja pyrkii siten lisäämään taajuuksien kohinaa . Lisäksi tämä menetelmä korjaa vain vaakasuorat perusviivat.
  • vähentämällä spektrin keskiarvo koko spektristä. Tällä tavoin saadulla spektrillä on nolla keskiarvo. Tämä menetelmä on parempi kuin edellinen, koska se leviää vähemmän melua käyttämällä kaikista pisteistä laskettua arvoa. Toisaalta se korjaa vain vaakasuorat perusviivat ja tuottaa spektrit negatiivisilla arvoilla, mikä voi olla hankalaa tiettyjen menetelmien soveltamisessa.
  • spektrin osalle lasketun linjan vähennys. Jos asiantuntemuksen perusteella tiedämme, että spektrin alueen tulisi olla nolla tai että kahdessa kaukaisessa pisteessä signaalin tulisi olla nolla, riittää laskea tämän alueen tai molempien pisteiden läpi kulkevan linjan yhtälö ja vähennä se spektristä.
  • " alentava " poistaa taajuuksien taustalla olevan yleisen suuntauksen. Regressio lasketaan paiseiden ja spektrin välillä mallilla, joka on vakiotyyppi (aste 0), lineaarinen (aste 1) tai polynomi (aste ≥ 2). Löydetty trendiviiva poistetaan spektristä. Huomaa, että asteen 0 detrend ei ole muuta kuin keskiarvon vähennys. Huomaa myös, että detrend asteen k on projektio kohtisuorassa tilaa asteluku on k . Detrendin avulla voit poistaa perusviivat, jotka ovat monimutkaisempia kuin yksinkertainen suora, mutta tuottaa negatiivisia arvoja, mikä voi olla hankalaa joidenkin menetelmien soveltamisessa.
  • Asymmetristen pienimpien neliöiden ALS-menetelmä tunnistaa spektrin perusviivan, jossa on rangaistava pienimmän neliösumman regressio. Ajatuksena on löytää signaali, joka lähestyy parhaiten spektriä pienimmässä neliösummassa, mutta jolla on sileä ulkonäkö taajuuskriteerissä. Tämä menetelmä on erityisen hyödyllinen Raman-spektrometriassa perusviivojen poistamiseksi fluoresenssin takia.
Skaalakorjaus (skaalaus)

Mitattu signaali x voidaan vaikuttaa Kerrannaisvaikutukse-, joka tarkoittaa sitä, että x voidaan mitata sijasta x , jossa ≠ 1. alalla kromatografian Kertoja vaikutus voi johtua tuotteen määrän analyysi. NMR- alalla analysoitavan tuotteen laimennus on vastuussa multiplikatiivisesta vaikutuksesta. Alalla PIR Kertoja vaikutus voi johtua geometrian ja mittaus- laitteen tai hiukkaskoon tuotteen . Kertovaikutus ei ole yhteensopiva lineaarisen algebran työkalujen kanssa. Itse asiassa mikä tahansa x: n käsittely lineaarisella algebralla johtaa yhteen tai useampaan matriisioperaatioon, kuten esimerkiksi t = x T P , missä P on kuormitusmatriisi . Jos x kerrotaan a: lla , tulos t kerrotaan myös a: lla . Toisin sanoen multiplikatiiviset vaikutukset kulkevat lineaaristen mallien läpi.

Monistuva vaikutus voidaan hoitaa soveltamalla logaritmia mitattuun signaaliin. Tämä edellyttää, ettei käsiteltävään signaaliin sisälly muita vaikutuksia, kuten perusviiva.

Normalisoinnin käyttö on yleisempää. Normalisointi koostuu jakamalla kaikki muuttujat signaalin x funktiolla d on x , siten, että d ( x ) = ad ( x ). Siten jokainen x johtaa samaan korjattu signaali z = x / d ( x ) = x / d ( x ), arvosta riippumatta . Vaikka spektrin normalisointimenetelmiä käytetään kullekin yksittäiselle spektrille, jotkut niistä edellyttävät tietojoukkoa korjauskertoimien laskemiseksi; tällöin esikäsittelyä ei tule tehdä ennen kalibrointi- ja testisarjojen määrittelyä, ja myös ristivalidoinnissa on oltava varovainen. Normalisointimenetelmiä on erilaisia:

  • Normalisointi maksimilla koostuu jakamalla kaikki spektrin arvot sen maksimilla. Tämän standardoinnin toteuttaminen on hyvin yksinkertaista. Mutta sitä ei suositella, koska käyttämällä vain yhtä arvoa multiplikatiivisen vaikutuksen arvioimiseksi se levittää kohinaa spektrille.
  • Normalisointi vaihteluvälillä koostuu jakamalla kaikki spektrin arvot signaalin erolla kahden tietyn spektrin pisteen välillä tai maksimin ja minimin välisellä erolla . Tällä menetelmällä on se etu, että multiplikatiivisen vaikutuksen arviointia ei perusteta yhteen arvoon.
  • Normalisointi spektrin normilla koostuu kaikkien spektrin arvojen jakamisesta spektrin kaikkien arvojen keskikeskellä. Tällä menetelmällä on se etu, että multiplikatiivisen vaikutuksen arvioinnin perustana on erittäin vakaa tilasto ja siten se ei lisää kohinaa.
  • Kun kerrannaisvaikutus arvioidaan käyttämällä kaikkia signaalin muuttujia, piikkien kantama (kemiaan liittyvä) informaatio laimennetaan koko spektrille. Probalistic Quotient Normalization (PQN) kehitettiin tämän ongelman ratkaisemiseksi. Se koostuu :
    • lasketaan kerrottava kerroin a käsiteltävän spektrin kunkin arvon ja vertailuspektrin vastaavan arvon välillä.
    • säilyttää kertomiskertoimen yleisimmän arvon
Lähtötason ja asteikon yhdistetty korjaus

Lähtötason pienentämistä ja spektrin skaalausta yhdistäviä menetelmiä käytetään laajasti. Joten:

  • Standard Normal Variate (SNV) vähentää spektrin keskimääräisestä voimakkuudestaan ​​ja jakaa sen sitten keskihajonnalla. Tätä menetelmää kutsutaan oikeutetusti myös online-vähennyskeskittymäksi.
  • MSC (Multiplicative Scatter Correction) tunnistaa kunkin spektrin additiivisen vaikutuksen ja multiplikatiivisen vaikutuksen vertailuspektriin verrattuna ja korjaa sen sitten nimenomaisesti:
    • laskenta ja sellainen
    • korjaus  :
  • Laajennettu moninkertainen signaalinkorjaus (EMSC) etenee kuten MSC, mutta monimutkaisemmilla lähtötavoilla kuin yksinkertainen vakio.

Samoin kuin skaalausmenetelmillä, SNV: n ja MSC: n menetelmillä on taipumus laimentaa informaatiota kantavat vyöhykkeet, kuten kemialliset piikit, koko spektrille. Tämä ongelma tunnetaan sulkemisena. Tämän ongelman voittamiseksi on ehdotettu useita vaihtoehtoisia menetelmiä. Ne kaikki perustuvat ajatukseen arvioida additiiviset ja multiplikatiiviset vaikutukset spektrien osiin, joihin vain nämä vaikutukset vaikuttavat.


Data-analyysi (EDA): valvomaton menetelmä

Valvomattomien menetelmien tarkoituksena on tutkia aineistoa, tuoda esiin tärkeimmät vaihtelulähteet ja määritellä näytteiden muodostamat ryhmät .

Ulottuvuuden vähentämismenetelmät AKT

PCA : n spesifisyys SPIR: n puitteissa on edustaa kunkin pääkomponentin kuormituksia taajuuksien muodossa.

Muut menetelmät

CANDECOMP / PARAFAC  (en)

Ryhmittely

Kvantitatiivisen muuttujan ennustaminen spektreistä

Lineaarinen

AKT ja PLS

Ei lineaarinen

Paikallinen PLS (LWPLS, paikallinen PLS), ANN, CNN, SVM

Laadullisen muuttujan ennustaminen spektreistä (tunnistaminen, luokittelu, syrjintä)

Lineaarinen

PLS-DA

Ei lineaarinen

kNN, CAH, RF, SVM

Hajoaminen ja spektriresoluutio (Beer Lambert -mallin kääntäminen)

Monimuuttujakäyrän resoluutio - Epäsymmetriset pienimmät neliöt (MCR-ALS)

SIMPLEX

Signaalinkäsittelymenetelmä

ICA

Kaukokartoitusmenetelmät

SIMPLEX

Muuttujien valinta

Erityisesti spektreihin soveltuvat menetelmät

CovSel, VIP, UVE

Monimuuttujan epätyypillisten pisteiden havaitseminen

T2: n ja Q: n käyttö

Joitakin esimerkkejä sovelluksista

NIRS: n käyttö monimutkaisten materiaalien (kasvit, ruoka, orgaaninen jäte, maaperä) kuvaamiseen

  • Viljoille ja siemenille ennustetaan erilaisia ​​ominaisuuksia: proteiinipitoisuus, aminohappo- tai rasvahappokoostumus ( katso alan viimeisimmät julkaisut täältä ).
  • Maaperälle ennustetaan myös erilaisia ​​ominaisuuksia: orgaaninen aines, rakenne, mineraalit, CEC, kuiva-aine, pH, kontaminaatio ( katso viimeisimmät tämän alan julkaisut täältä ).
  • FlashBMP kehitettiin ennustamaan metaanin (BMP) biokemiallinen potentiaali erilaisissa metanisointiin tarkoitetuissa orgaanisissa jätteissä (yhdyskuntajätteet, maatalouselintarvikejätteet, ruokalajätteet). Nykyinen käyttö vaatii materiaalin lyofilisoinnin ja jauhamisen.

Viitteet

  1. (en) Svante Wold , "  Kemometria; mitä tarkoitamme sen kanssa ja mitä me siitä haluamme?  ” , Chemometrics and Intelligent Laboratory Systems , voi.  30, n o  1,Marraskuu 1995, s.  109-115 ( ISSN  0169-7439 , DOI  10,1016 / 0169-7439 (95) 00042-9 , lukea verkossa , pääsee 03 syyskuu 2019 )
  2. (in) Kim Esbensenille Paul Geladi , "  alku ja varhaisen historian kemometriikan: Selected haastatteluja. Osa 2  ” , Journal of Chemometrics , voi.  4, n o  6,Marraskuu 1990, s.  389-412 ( ISSN  0886-9383 ja 1099-128X , DOI  10.1002 / cem.1180040604 , luettu verkossa , käytetty 3. syyskuuta 2019 )
  3. (sisään) HM Heise ja R. Winzen , "Chemometrics in Near-Infrared Spectroscopy" in Near-Infrared Spectroscopy , Wiley-VCH Verlag GmbH ( ISBN  9783527612666 , lue verkossa ) , s.  125–162
  4. (in) Comprehensive Chemometrics: kemialliset ja biokemialliset data-analyysi , Amsterdam, Elsevier,2009( ISBN  978-0-444-52701-1 , lue verkossa )
  5. http://math.agrocampus-ouest.fr/infoglueDeliverLive/digitalAssets/41740_Poly_Bertrand_2008.pdf
  6. https://tel.archives-ouvertes.fr/tel-01341959/document
  7. https://tel.archives-ouvertes.fr/tel-00685887/document
  8. https://serval.unil.ch/resource/serval:BIB_DD70B27E1A48.P003/REF.pdf
  9. https://agritrop.cirad.fr/567909/1/document_567909.pdf
  10. Carl Meyer , Matrix Analysis and Applied Linear Algebra , SIAM,1. st tammikuu 2000, 718  Sivumäärä ( ISBN  978-0-89871-454-8 , lue verkossa )
  11. BGM Vandeginste , DL Massart , LMC Buydens ja S. De Jong , "Johdatus osaan B" , tieteen ja tekniikan tietojenkäsittelyssä , Elsevier,1998( ISBN  978-0-444-82853-8 , lue verkossa ) , s.  1–5
  12. Tomas Isaksson ja Tormod Næs , "  Multiplikatiivisen sirontakorjauksen (MSC) ja lineaarisuuden parantamisen vaikutus NIR-spektroskopiassa  ", Applied Spectroscopy , voi.  42, n °  7,Syyskuu 1988, s.  1273–1284 ( ISSN  0003-7028 ja 1943-3530 , DOI  10.1366 / 0003702884429869 , luettu verkossa , käytetty 2. tammikuuta 2020 )
  13. Nils Kristian Afseth , Vegard Herman Segtnan ja Jens Petter Wold , "  Raman Spectra of Biological Sample : A Study of Preprocessing Methods  " Applied Spectroscopy , Voi.  60, n °  12,joulukuu 2006, s.  1358–1367 ( ISSN  0003-7028 ja 1943-3530 , DOI  10.1366 / 000370206779321454 , luettu verkossa , käytetty 2. tammikuuta 2020 )
  14. Rasmus Bro ja Age K. Smilde , ”  Keskittäminen ja skaalaus komponenttianalyysissä  ”, Journal of Chemometrics , voi.  17, n o  1,tammikuu 2003, s.  16–33 ( ISSN  0886-9383 ja 1099-128X , DOI  10.1002 / cem.773 , luettu verkossa , käytetty 7. syyskuuta 2019 )
  15. Kristian Hovde Liland , Trygve Almøy ja Bjørn-Helge Mevik , ”  Optimal valinta lähtötilanteessa korjaus monimuuttuja kalibrointi Spectra  ”, Applied Spectroscopy , voi.  64, n o  9,syyskuu 2010, s.  1007–1016 ( ISSN  0003-7028 ja 1943-3530 , DOI  10.1366 / 000370210792434350 , luettu verkossa , käytetty 7. syyskuuta 2019 )
  16. Jean-Claude Boulet ja Jean-Michel Roger , "  Esikäsittelyt ortogonaalisten projektioiden avulla  ", Chemometrics and Intelligent Laboratory Systems , voi.  117,Elokuu 2012, s.  61–69 ( ISSN  0169-7439 , DOI  10.1016 / j.chemolab.2012.02.002 , luettu verkossa , käytetty 7. syyskuuta 2019 )
  17. Gilles Rabatel , Federico Marini , Beata Walczak ja Jean - Michel Roger , "  VSN: Variable sorting for normalization  ", Journal of Chemometrics ,29. heinäkuuta 2019( ISSN  0886-9383 ja 1099-128X , DOI  10.1002 / cem.3164 , luettu verkossa , kuultu 9. syyskuuta 2019 )
  18. RJ Barnes , MS Dhanoa ja Susan J. Lister , ”  Lähi-infrapuna-diffuusioheijastusspektrin normaalin normaalin vaihtelevan muutoksen ja suuntauksen poistaminen  ”, Applied Spectroscopy , voi.  43, n o  5,Heinäkuu 1989, s.  772–777 ( ISSN  0003-7028 ja 1943-3530 , DOI  10.1366 / 0003702894202201 , luettu verkossa , käytetty 2. tammikuuta 2020 )
  19. Harald Martens ja Edward Stark , "  Laajennettu multiplikatiivisen signaalin korjaus ja spektrihäiriöiden vähennys: Uudet esikäsittelymenetelmät lähellä infrapunaspektroskopiaa  ", Journal of Pharmaceutical and Biomedical Analysis , voi.  9, n o  8,Tammikuu 1991, s.  625-635 ( ISSN  0731-7085 , DOI  10.1016 / 0731-7085 (91) 80188-e , luettu verkossa , käytetty 2. tammikuuta 2020 )
  20. M. Bylesjö , O. Cloarec ja M. Rantalainen , “Normalisointi ja sulkeutuminen” , Comprehensive Chemometrics , Elsevier,2009( ISBN  978-0-444-52701-1 , lue verkossa ) , s.  109–127
  21. Q Guo , W Wu ja DL Massart , "  Vankka normaali vaihtelumuunnos kuvion tunnistamiseksi lähellä infrapunatietoa  ", Analytica Chimica Acta , voi.  382, n luut  1-2,Helmikuu 1999, s.  87-103 ( ISSN  0003-2670 , DOI  10,1016 / s0003-2670 (98) 00737-5 , lukea verkossa , pääsee 02 tammikuu 2020 )
  22. Gilles Rabatel , Federico Marini , Beata Walczak ja Jean - Michel Roger , "  VSN: Variable sorting for normalization  ", Journal of Chemometrics ,29. heinäkuuta 2019( ISSN  0886-9383 ja 1099-128X , DOI  10.1002 / cem.3164 , luettu verkossa , kuultu 2. tammikuuta 2020 )
  23. Bo Stenberg , Raphael A.Viscarra Rossel , Abdul Mounem Mouazen ja Johanna Wetterlind , "Viides luku - Näkyvä ja lähellä oleva infrapunaspektroskopia maaperätutkimuksessa" , julkaisussa Advances in Agronomy , voi.  107, akateeminen lehdistö,1. st tammikuu 2010( DOI  10.1016 / s0065-2113 (10) 07005-7 , lue verkossa ) , s.  163–215
  24. "  Methods of Chemometrics and Machine Learning / Ondalys  " , ondalys (käytetty 20. elokuuta 2020 ) .
  25. M. Lesteur , E. Latrille , V. Bellon Maurel ja JM Roger , ”  ensimmäinen vaihe nopea analyysimenetelmä määrittämiseksi Biochemical Metaani Mahdolliset kiinteää jätettä, jonka kohteen infrapunaspektroskopialla  ”, Bioresource Technology , voi.  102, n °  3,1. st helmikuu 2011, s.  2280–2288 ( ISSN  0960-8524 , DOI  10.1016 / j.biortech.2010.10.044 , luettu verkossa , käytetty 26. elokuuta 2019 )
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">