Tip:
Highlight text to annotate it
X
Vi börjar med att införa lite grundläggande terminologi
som ofta används inom artificiell intelligens för att särskilja olika typer av problem.
Det allra första begreppet jag kommer att lära dig är helt kontra delvis observerbar.
En omgivning är fullt observerbar om din agent, vid varje enskilt tillfälle, kan
se tillräckligt mycket av sin omgivning för att fatta ett optimalt beslut.
Exempelvis, i många kortspel,
när alla kort ligger på bordet, är den kortens placering tillräckligt
för att göra ett optimalt val.
I kontrast till detta står vissa miljöer där agenten behöver ett minne
för att kunna fatta ett optimalt val.
I till exempel poker ligger inte alla kort öppna på bordet,
och memorisering av tidigare drag kommer att hjälpa dig fatta bättre beslut.
För att till fullo förstå skillnaden, betrakta agentens interaktion med omgivningen
med hjälp av sina sensorer och aktuatorer,
och denna interaktion sker över flera cykler,
ofta kallat perceptions-aktions-cykeln.
För många miljöer är det bekvämt att anta
att miljön har någon form av inre tillstånd.
Till exempel, i ett kortspel där korten inte ligger öppet på bordet,
kan tillståndet representera din egen hand.
En miljö är fullständigt observerbar om sensorerna alltid kan se
hela tillståndet i miljön.
Det är delvis observerbar om sensorerna bara kan se en del a det inre tillståndet,
samtidigt kan vi, om minns tidigare tillstånd, erhålla ytterligare information
utöver det delområde vi kan överblicka för tillfället.
Så alla spel, till exempel, där tidigare drag kan ge ledtrådar om andra
spelares händer, är delvis observerbara,
och de kräver olika strategier.
Väldigt ofta måste agenter som arbetar med delvis observerbara miljöer
förvärva ett internt minne för att förstå vad
tillståndet i miljön är, och vi att behandla detta utförligt
när vi talar om dolda Markov-modeller om hur denna struktur
har ett sådant internt minne.
En annan term som härrör agentens miljö
är huruvida den är deterministisk eller stokastisk.
I en deterministisk miljö bestäms resultatet
av (enbart) agentens handlingar.
Så, till exempel, i schack, finns det verkligen ingen slumpmässighet när du flyttar en pjäs.
Effekten av att flytta en pjäs är helt förutbestämd,
Och oavsett var jag flyttar samma pjäs, är resultatet detsamma.
Detta kallar vi en deterministisk miljö.
Spel med tärningar, till exempel, som backgammon, är stokastiska.
Även om ditt drag fortfarande är deterministisk,
beror utgången också av tärningskastet,
vilket du inte kan förutsäga resultatet av.
Resultatet av tärningskast har ett element av slumpmässighet,
och därför kallar vi det en stokastisk miljö.
Låt mig tala om diskret kontra kontinuerlig.
En diskret miljö är en där du har ändligt många val (handlingsalternativ),
och ändligt många objekt du kan känna.
Återigen, i schack finns ett ändligt antal positioner på brädet,
och ett ändligt antal möjliga val.
Detta skiljer sig från en kontinuerlig miljö
där antalet val eller antalet möjliga sinnesintryck kan vara oändligt.
Om du till exempel kastar pil, så är antalet sätt att vinkla och accelerera
pilen i kastet oändligt.
Slutligen skiljer vi mellan godartade (benigna) respektive fientliga miljöer.
I en benign miljö kan du ha en slumpmässig omgivning.
Den kan vara stokastisk, men saknar egen agenda
som strider mot ditt eget mål.
Exempelvis är vädret godartat.
Det kan vara slumpmässigt. Det kan påverka resultatet av dina handlingar.
Men det är inte ute efter att sätta dit dig.
Jämför detta med en fientlig miljö, exempelvis schack,
där din motståndare aktivt försöker besegra dig.
Det visar sig vara mycket svårare att handla korrekt i en fientlig miljö
där motståndaren aktivt bevakar och motarbetar dig
i jämförelse med en benign miljö, där miljön förvisso kan vara stokastisk
men i alla fall inte aktivt är ute efter att förstöra ditt liv.
Så, låt oss se hur bra du förstått dessa nya begrepp
genom att göra nästa quiz.
Så här är de 4 begreppen igen: delvis observerbara kontra fullt observerbara,
stokastiska kontra deterministiska, kontinuerlig kontra diskret,
respektive fientlig kontra benign.
Och låt mig fråga er om spelet Dam.
Markera samtliga attribut som gäller.
Så, om du tror Dam är delvis observerbart, markera här.
Annars, låt bli att markera.
Om du tror att Dam är stokastiskt, markera här,
kontinuerlig, markera här, fientlig, markera här.
Om du inte känner till Damspel, så kan du googla det (ö.a.: http://sv.wikipedia.org/wiki/Damspel)
för att hitta lite mer information om Damspel.