Q-Learning on Vacuum Cleaner


Progetto di
Francesco (Galt) Faloci
"Interactive intelligent devices, systems and environments"
Q-Learning on Vacuum Cleaner
-
Q-Learning
- Vacuum Cleaner
Q-Learning on Vacuum Cleaner
Q-Learning
-
Model-Free Oriented
-
Q (Stato, Azione)
- Funzione di Apprendimento
Q-Learning on Vacuum Cleaner
Model Oriented
Training
Model
Class Set X
Training Set K
Class Set Y
Q-Learning on Vacuum Cleaner
Model-Free Oriented
Training
Set X
Strategy Set X+1
New Set X+1
Q-Learning on Vacuum Cleaner
Q (Stato, Azione)
Q t-1 (Stato, Azione) + Apprendimento (Stato, Azione)
Q t (Stato, Azione)
Q tnew (Stato, Azione) =
Gain tnew + [max Q (Stato tnew, Azione tnew) - Q t-1 (Stato, Azione) ]
Q-Learning on Vacuum Cleaner

Q-Learning on Vacuum Cleaner
Vacuum Cleaner
Q-Learning on Vacuum Cleaner
Vacuum Cleaner
-
1 Agente
-
Mappa n x m
-
[Spazi vuoti] [Sporco] [Ostacoli]
- Obbiettivo: miglior percorso per pulire
Q-Learning on Vacuum Cleaner
Vacuum Cleaner
Q-Learning on Vacuum Cleaner
Vacuum Cleaner
-
Funzione di Attivazione: program()
-
Funzione di training: train()
-
Funzione di costo: qCostFunction()
Q-Learning on Vacuum Cleaner
Prova sul campo...
Grazie dell'Attenzione
</END>
Q-Learning on Vacuum Cleaner
Q-Learning on Vacuum Cleaner
By frafolo
Q-Learning on Vacuum Cleaner
- 174