4a. Robot Race (機械人比賽)
學習目標 :
親身訓練及體驗「無人駕駛」的 AI 模型。
學習內容 :
- 用監督式學習法 (Supervised Learning) 訓練「無人駕駛」的 AI 模型。
- 訓練資料 (training data) 應該包括什麼呢?
所需準備 :
材料: | Parameter 參數 : “使用Demo參數 “Robot Race” |
|
Racing Circuit | 建議使用 AlphAI 官方所製的 Circuit |
導入 Demo Parameter "Robot Race" :
在工具欄中選擇「parameters」再按「load demo parameters」 。
在 「Supervised Learning」中選取「Robot Race」
訓練 :
- 點擊<重置學習>按鈕一次。關閉<自動駕駛>按鈕。
- 點擊<學習>按鈕。
- 建議將速度設成 20 - 25 , 不要太快。
- 將機器人放在起點。觀察機器人,點擊屏幕右側的箭頭來移動機器人。
- 首先,點擊“向前”箭頭移動機器人。讓機器人進入賽道。
- 訓練2至3圈重複上述步驟。
**您可以重新執行訓練,嘗試處理機器人可能遇到的更多情況。
例如,撞到牆壁或進入轉彎。進行更多訓練將使機器人更聰明。
**假如剛剛一步訓練錯誤,可以選擇忘記最後一步(forget last step) ,去刪除最後一步錯誤的學習。
測試(使用) :
- 關閉<學習>按鈕。點擊<自動駕駛>按鈕。機器人將使用學習的智能來移動。
- 測試機器人是否準備好比賽。
- 2至3個機器人一起開始比賽。
討論 :
- 機器人能參加比賽嗎?為什麼?
- 你訓練了多少次? (查看 experience buffer 上的數字)
- 有哪些輸入?您使用了多少個輸入?
- 有哪些輸出?機器人比賽中有多少輸出?
- 已經實現了學習嗎?
- 機器人在訓練後是否獲得了智能?
- 討論監督學習法的概念。
延伸討論 :
- 機械人懂得沿着賽道移動嗎? 為什麼機械人懂得沿着賽道移動呢?
- 對於這個實驗,輸入是甚麽?有多少個輸入(像素)?
- 輸岀是甚麽?有多少個輸出?
- 學習有沒有發生過?機械人是否獲取了智能? 討論甚麽是監督式學習法。
總結 :
- 訓練重點:首先是教導機械人順利圍圈跑;不要接近紅色牆,不要接近黑色牆。轉彎時,行深一些,避開中間的黑色牆。
- 中階訓練:當機械人接近紅色牆時,懂得轉右走出來,避免撞紅牆。當機械人接近黑色牆時,懂得轉左走出來,避免撞黑牆。
- 高階訓練:撞到了紅色牆時,懂得走出來(轉右)。撞到了黑色牆時,懂得走路出來(轉左)。
- 死位訓練:當轉彎時,封死在黑牆的邊緣上,懂得轉出來。封死在角位上,懂得轉出來。
- 最後,將速度調教到一個平衡水平,快但不失控。