Tip:
Highlight text to annotate it
X
E' bene introdurre un po' di terminologia di base
comunemente usata in intelligenza artificiale per distinguere diversi tipi di problemi
Il primo termine che vi insegnerò è completamente o parzialmente osservabile
Un ambiente è definito completamente osservabile se quello che il vostro agente può ispezionare
in un qualunque momento è completamente sufficiente per prendere la decisione migliore.
Per esempio, in molti giochi di carte,
quando tutte le carte sono sul tavolo, la posizione istantanea di tutte le carte
è sufficiente a prendere la decisione migliore.
Questo a differenza di altri ambienti in cui c'è bisogno di memoria
dal lato dell'agente per prendere la miglior decisione possibile.
Per esempio, nel gioco del poker, le carte non sono tutte scoperte sul tavolo,
e memorizzare le mosse precedenti vi aiuterà a prendere una decisione migliore.
Per capire appieno la differenza, considerate l'interazione di un agente
con l'ambiente attraverso i suoi sensori ed attuatori,
e questa interazione avviene attraverso diversi cicli,
spesso chiamati cicli di percezione-azione.
Per molti ambienti, è conveniente supporre
che l'ambiente abbia un qualche stato interno.
Per esempio, in un gioco di carte in cui le carte non sono scoperte sul tavolo,
lo stato potrebbe essere costituito dalle carte che avete in mano.
Un ambiente è completamente osservabile se i sensori possono sempre vedere
l'interno stato dell'ambiente.
E' parzialmente osservabile se i sensori possono vedere solo una frazione dello stato,
ma memorizzare le misure precedenti ci dà informazioni aggiuntive sullo stato
che non è immediatamente osservabile in questo momento.
Per esempio, per qualunque gioco in cui le mosse precedenti danno informazioni
su quello che una persona potrebbe avere in mano, quei giochi sono parzialmente osservabili,
e richiedono un trattamento differente.
Molto spesso agenti che si occupano di ambiente parzialmente osservabili
hanno bisogno di memoria interna per capire
quale sia lo stato dell'ambiente, e parleremo a lungo
quando parleremo dei modelli di Markov nascosti, di come questa struttura
abbia una simile memoria interna.
Una seconda classificazione degli ambiente attiene al fatto che l'ambiente
sia deterministico o stocastico.
Un ambiente deterministico è uno in cui le azioni dell'agente
determinano in maniera univoca il risultato.
Per esempio, negli scacchi, non c'è una casualità quando si muove un pezzo.
L'effetto di muovere un pezzo è completamente predeterminato,
e indipendentemente da dove muoverò lo stesso pezzo, il risultato è lo stesso.
Questo è ciò che chiamiamo deterministico.
I giochi con i dadi, per esempio, come il backgammon, sono stocastici.
Sebbene tu possa sempre muovere i tuoi pezzi in maniera deterministica,
il risultato di un'azione implica anche il lancio del dado,
e quello non lo puoi prevedere.
C'è un certo grado di casualità connesso al risultato di un dado,
e questo quindi lo chiamiamo stocastico.
Parliamo adesso di discreto rispetto a continuo.
Un ambiente discreto è uno in cui ha un numero finito di scelte di azione,
e un numero finito di cose che puoi misurare.
Per cui, per esempio, di nuovo negli scacchi, c'è un numero finito di posizioni della scacchiera,
e un numero finito di cose che puoi fare.
E' diverso da un ambiente continuo
in cui lo spazio delle possibili azioni o delle cose che puoi misurare potrebbe essere infinito.
Per esempio, se lanci delle freccette, c'è un numero infinito di modi in cui angolare le freccette
e in cui accelerarle.
Infine, distinguiamo tra ambiente benevolo e ambiente avverso.
In un ambiente benevolo, l'ambiente potrebbe essere casuale
Potrebbe essere stocastico, ma non ha un suo obiettivo
che potrebbe contraddire il nostro obiettivo.
Per esempio, il tempo atmosferico è benevolo,
potrebbe essere casuale, potrebbe avere un effetto sulle tue azioni,
ma non è lì per batterti.
Confronta questo con gli ambienti avversi, come in molti giochi, come gli scacchi,
in cui il tuo avversario è lì per batterti.
Ne risulta che è molto più difficile trovare azioni giuste in ambienti avversi
in cui la controparte ti osserva attivamente e contrasta quello che stai cercando di ottenere
piuttosto che in ambienti benevoli, in cui l'ambiente potrebbe essere semplicemente stocastico
ma non è davvero interessato a renderti la vita peggiore.
Vediamo fino a che punto queste cose hanno senso per voi
passando al prossimo quiz.
Ecco di nuovo i 4 concetti: parzialmente contro completamente osservabile,
stocastico contro deterministico, continuo contro discreto,
avverso contro benevolo.
E vi faccio una domanda sul gioco della dama.
Selezionato uno o più di quegli attributi che sono corretti.
Per cui, se pensate che la dama sia parzialmente osservabile, selezionate questo.
Altrimenti, non selezionatelo.
Se pensate che sia stocastico, selezionate questo,
continuo, selezionate questo, avverso, selezionate questo.
Se non conoscete la dama, potete controllare sul web e cercare su Google
per qualche informazione in più sulla dama.