Minimax-algoritmi

Minimax algoritmi (myös nimitystä MinMax algoritmi ) on algoritmi, joka koskee peliteorian kahden pelaajan nolla-summa (ja täysi-informaatio) pelien minimoida enimmäistappio (eli sanoa pahimmassa tapauksessa). Suurelle peliperheelle von Neumannin minimx-lause varmistaa tällaisen algoritmin olemassaolon, vaikka käytännössä sen löytäminen ei ole usein helppoa. Hex- peli on esimerkki siitä, että tällaisen algoritmin olemassaolo todetaan ja osoittaa, että ensimmäinen pelaaja voi aina voittaa ilman, että tätä strategiaa tunnetaan.

Se saa tietokoneen käymään läpi kaikki mahdollisuudet rajalliseen määrään siirtoja ja antamaan heille arvon, joka ottaa huomioon pelaajan ja hänen vastustajansa edut. Paras valinta on silloin valinta, joka minimoi pelaajan tappiot olettaen, että vastustaja pyrkii päinvastoin maksimoimaan ne (peli on nolla).

On olemassa erilaisia algoritmeja perustuvat MinMax optimoida etsiä parhaan tilanteen rajoittamalla solmujen vieraillut pelin puussaPelipuu , tunnetuin on alfa-beeta karsimisesta . Käytännössä puu on usein liian suuri tutkittavaksi (kuten shakki- tai mennäpelissä ). Sitten tutkitaan vain murto-osa puusta.

Hyvin suurten puiden kohdalla tekoälyä (asiantuntijajärjestelmä, arviointi oppimalla esimerkeistä jne.) Voidaan käyttää tiettyjen oksien karsimiseen niiden hyödyllisyyden arvioinnin perusteella. Tätä käytetään esimerkiksi go-kontekstissa.

Periaate

Minimumx-algoritmi vierailee pelipuussa jäljittäen juurelle arvon (nimeltään "pelin arvo"), joka lasketaan rekursiivisesti seuraavasti:

$minimx ( p ) = f ( p ),$ jos $p$ on puun lehti, jossa $f$ on pelin sijainnin arviointifunktio;
$minimx ( p ) = max (minimax ( O 1 ),\dots, minimx ( O n )),$ jos $p$ on pelaaja-solmu, jossa on lapsia $O 1 ,\dots, O n$ ;
$minimx ( p ) = min (minimx ( O 1 ),\dots, minimx ( O n )),$ jos $p$ on vastakkainen solmu lasten kanssa $O 1 ,\dots, O n$ .

Esimerkki

Yllä olevassa kaaviossa harmaat solmut edustavat pelaajan solmuja ja siniset vastakkaisia solmuja. Solmun A arvon määrittämiseksi valitsemme solmujoukon B maksimiarvon (A on pelaajasolmu). Siksi on tarpeen määrittää niiden solmujen B arvot, jotka kukin saavat lapsiinsa tallennetun vähimmäisarvon (solmut B ovat vastakkaisia). Solmut C ovat lehtiä, joten niiden arvo voidaan laskea arviointitoiminnolla.

Solmu A ottaa sen vuoksi arvon 5. Pelaajan on siis pelattava siirto tuoden se kohtaan B2. Puuta tarkkailemalla ymmärrämme, että algoritmi katsoo, että vastustaja pelaa parhaalla mahdollisella tavalla: hän ottaa minimin. Ilman tätä predikaatti, olisimme valita solmu C 1 , joka tarjoaa suurimman vahvistuksen ja seuraava siirto valitun johtaisi B1. Mutta sitten otamme riskin, että vastustaja pelaa C3: ta, joka tarjoaa vain 3: n voiton.

Käytännössä sijainnin P teoreettista arvoa ei yleensä voida laskea. Tämän seurauksena arvostusfunktiota sovelletaan muihin kuin terminaalisiin positioihin. Katsotaan, että mitä pidemmälle arviointitoimintoa käytetään juuresta, sitä parempi on laskennan tulos. Toisin sanoen tarkastelemalla useampia peräkkäisiä aivohalvauksia oletamme saavan paremman likiarvon teoreettisesta arvosta ja siten paremman liikkeen valinnan.

Negamax-yksinkertaistaminen

Jos $f ( p ): n$ ottama arvojoukko on symmetrinen nollan suhteen, funktio $g ( p )$ voidaan määrittää siten, että:

$g ( p ) = f ( p ),$ jos olemme pelaajasolmussa
$g ( p ) = - f ( p ),$ jos olemme vastakkaisessa solmussa

Joten määritämme negamaxin tästä uudesta toiminnosta:

$negamax ( p ) = g ( p ),$ jos P on terminaali
$negamax ( p ) = max (-NegaMax ( p i ))$ muuten

Samasta esimerkistä kuin Minmax-algoritmille, tässä on tuloksena oleva puu:

Pseudokoodi

Rajoitetun syvyyden minimx-algoritmin pseudokoodi on esitetty alla:

function minimax(node, depth, maximizingPlayer) is if depth = 0 or node is a terminal node then return the heuristic value of node if maximizingPlayer then value := −∞ for each child of node do value := max(value, minimax(child, depth − 1, FALSE)) return value else (* minimizing player *) value := +∞ for each child of node do value := min(value, minimax(child, depth − 1, TRUE)) return value (* Initial call *) minimax(origin, depth, TRUE)

Sovellukset

Minimax ja tilastoteoria

Valinnaisessa tilastoteoriassa meillä on estimaattori $δ,$ jonka tavoitteena on löytää parametri $θ \in Θ$ . Tässä yhteydessä $θ$ 'minimx', jos:

{\ displaystyle \ sup _ {\ theta} R (\ theta, {\ tilde {\ delta}}) = \ inf _ {\ delta} \ sup _ {\ theta} R (\ theta, \ delta).}

Alfa-beeta-karsiminen

Tämä algoritmi voidaan optimoida toteuttamalla tekniikka, joka tunnetaan nimellä alfa-beeta-karsiminen . Alfa-beeta-algoritmi nopeuttaa minimx-hakutoimintoa poistamalla tapaukset, joita ei käytetä. Tässä menetelmässä käytetään sitä, että kaikki muut puun tasot maksimoidaan ja kaikki muut tasot minimoidaan.

Liitteet

Huomautuksia

Jean-Marc Alliot ja Thomas Schiex , ” Pelien ohjelmointi” , julkaisussa Artificial Intelligence and Theoretical Computing , Cepadues,1994( ISBN 2-85428-324-4 )
Mutta jos pelaajat eivät tiedä vastustajansa tekemiä liikkeitä, kuten rock-paper-sakset -pelissä , tämä algoritmi johtaa vain strategioihin, jotka edellyttävät sattuman käyttöä; katso lauseen artikkelista lisätietoja

Bibliografia

A. Aho , J. Hopcroft, J. Ullman , Tietorakenteet ja algoritmit , Pariisi, InterEditions,1987, 450 Sivumäärä ( ISBN 978-2-7296-0194-2 , ilmoitusta BNF n o FRBNF34973701 ) , "algoritmiset käsitysten ja strategioita"

Aiheeseen liittyvät artikkelit

Ulkoinen linkki

(en) selitys tronipelin minimx-algoritmille osana google ai -haastetta