2018.06.22 柯筑苓
2021 更新:
投影片做得很爛,看部落格比較快喔:
https://ko19951231.github.io/2021/01/01/2048/
感恩各位
你用人腦+人手認真玩,可以玩到多高?
你設計的簡單AI可以玩到多高?
理想上,學完這些,你的AI可以高出它們非常非常多
如何量化「這場遊戲玩得多好」?
選一個就好囉
假設選了「賺的總分」當成目標
那麼你的AI每一步都要選擇
「可以讓這場遊戲賺到最大總分」的走法
這一頁不能破梗
上下左右選哪個
依照你目前的模型來決定動作
玩到死為止
記得每一步的盤面樣子、那步得到的分數,都要存起來(vector之類的)
現在你有了一場遊戲的經驗
請藉由這個經驗讓這些盤面的值都往真相邁進一步
白板畫圖
temporal difference learning