Q-Learning on Vacuum Cleaner

Progetto di
 

Francesco (Galt) Faloci

"Interactive intelligent devices, systems and environments"

Q-Learning on Vacuum Cleaner

  • Q-Learning

     
  • Vacuum Cleaner

Q-Learning on Vacuum Cleaner

Q-Learning

  • Model-Free Oriented
     
  • Q (Stato, Azione)
     
  • Funzione di Apprendimento

Q-Learning on Vacuum Cleaner

Model Oriented

Training

Model

Class Set X

Training Set K

Class Set Y

Q-Learning on Vacuum Cleaner

Model-Free Oriented

Training

Set X

Strategy Set X+1

New Set X+1

Q-Learning on Vacuum Cleaner

Q (Stato, Azione)

Q t-1 (Stato, Azione) + Apprendimento (Stato, Azione)

Q t (Stato, Azione)

Q tnew (Stato, Azione) =
Gain tnew + [max Q (Stato tnew, Azione tnew) - Q t-1 (Stato, Azione) ]

Q-Learning on Vacuum Cleaner

Q-Learning on Vacuum Cleaner

Vacuum Cleaner

Q-Learning on Vacuum Cleaner

Vacuum Cleaner

  • 1 Agente
     
  • Mappa n x m
     
  • [Spazi vuoti] [Sporco] [Ostacoli]
     
  • Obbiettivo: miglior percorso per pulire

Q-Learning on Vacuum Cleaner

Vacuum Cleaner

Q-Learning on Vacuum Cleaner

Vacuum Cleaner

  • Funzione di Attivazione: program()
     
  • Funzione di training: train()
     
  • Funzione di costo: qCostFunction()
     

Q-Learning on Vacuum Cleaner

Prova sul campo...

Grazie dell'Attenzione

</END>

Q-Learning on Vacuum Cleaner

Q-Learning on Vacuum Cleaner

By frafolo

Q-Learning on Vacuum Cleaner

  • 174