4a. Robot Race (機械人比賽)

學習目標 :

親身訓練及體驗「無人駕駛」的 AI 模型。

學習內容 :

  • 用監督式學習法 (Supervised Learning) 訓練「無人駕駛」的 AI 模型。
  • 訓練資料 (training data) 應該包括什麼呢?

所需準備 :

 
材料: Parameter 參數 :
“使用Demo參數 “Robot Race”
Racing Circuit 建議使用 AlphAI 官方所製的 Circuit

導入 Demo Parameter "Robot Race" :

在工具欄中選擇「parameters」再按「load demo parameters」 。

在 「Supervised Learning」中選取「Robot Race」

訓練 :

  • 點擊<重置學習>按鈕一次。關閉<自動駕駛>按鈕。
  • 點擊<學習>按鈕。
  • 建議將速度設成 20 - 25 , 不要太快。
  • 將機器人放在起點。觀察機器人,點擊屏幕右側的箭頭來移動機器人。
  • 首先,點擊“向前”箭頭移動機器人。讓機器人進入賽道。
  • 訓練2至3圈重複上述步驟。

**您可以重新執行訓練,嘗試處理機器人可能遇到的更多情況。

例如,撞到牆壁或進入轉彎。進行更多訓練將使機器人更聰明。

**假如剛剛一步訓練錯誤,可以選擇忘記最後一步(forget last step) ,去刪除最後一步錯誤的學習。

測試(使用) :

  • 關閉<學習>按鈕。點擊<自動駕駛>按鈕。機器人將使用學習的智能來移動。
  • 測試機器人是否準備好比賽。
  • 2至3個機器人一起開始比賽。

討論 :

  • 機器人能參加比賽嗎?為什麼?
  • 你訓練了多少次? (查看 experience buffer 上的數字)
  • 有哪些輸入?您使用了多少個輸入?
  • 有哪些輸出?機器人比賽中有多少輸出?
  • 已經實現了學習嗎?
  • 機器人在訓練後是否獲得了智能?
  • 討論監督學習法的概念。

延伸討論 :

  • 機械人懂得沿着賽道移動嗎? 為什麼機械人懂得沿着賽道移動呢?
  • 對於這個實驗,輸入是甚麽?有多少個輸入(像素)? 
  • 輸岀是甚麽?有多少個輸出? 
  • 學習有沒有發生過?機械人是否獲取了智能? 討論甚麽是監督式學習法

總結 :

  • 訓練重點:首先是教導機械人順利圍圈跑;不要接近紅色牆,不要接近黑色牆。轉彎時,行深一些,避開中間的黑色牆。
  • 中階訓練:當機械人接近紅色牆時,懂得轉右走出來,避免撞紅牆。當機械人接近黑色牆時,懂得轉左走出來,避免撞黑牆。
  • 高階訓練:撞到了紅色牆時,懂得走出來(轉右)。撞到了黑色牆時,懂得走路出來(轉左)。
  • 死位訓練:當轉彎時,封死在黑牆的邊緣上,懂得轉出來。封死在角位上,懂得轉出來。
  • 最後,將速度調教到一個平衡水平,快但不失控。