Coding and STEM

4a. Robot Race (機械人比賽)

學習目標 :

親身訓練及體驗「無人駕駛」的 AI 模型。

學習內容 :

用監督式學習法 (Supervised Learning) 訓練「無人駕駛」的 AI 模型。
訓練資料 (training data) 應該包括什麼呢？

所需準備 :

材料:	Parameter 參數 : “使用Demo參數 “Robot Race”
Racing Circuit	建議使用 AlphAI 官方所製的 Circuit

導入 Demo Parameter "Robot Race" :

在工具欄中選擇「parameters」再按「load demo parameters」。

在「Supervised Learning」中選取「Robot Race」

訓練 :

點擊<重置學習>按鈕一次。關閉<自動駕駛>按鈕。
點擊<學習>按鈕。
建議將速度設成 20 - 25 , 不要太快。
將機器人放在起點。觀察機器人，點擊屏幕右側的箭頭來移動機器人。
首先，點擊“向前”箭頭移動機器人。讓機器人進入賽道。
訓練2至3圈重複上述步驟。

**您可以重新執行訓練，嘗試處理機器人可能遇到的更多情況。

例如，撞到牆壁或進入轉彎。進行更多訓練將使機器人更聰明。

**假如剛剛一步訓練錯誤，可以選擇忘記最後一步（forget last step) ，去刪除最後一步錯誤的學習。

測試(使用) :

關閉<學習>按鈕。點擊<自動駕駛>按鈕。機器人將使用學習的智能來移動。
測試機器人是否準備好比賽。
2至3個機器人一起開始比賽。

討論 :

機器人能參加比賽嗎？為什麼？
你訓練了多少次？ (查看 experience buffer 上的數字)
有哪些輸入？您使用了多少個輸入？
有哪些輸出？機器人比賽中有多少輸出？
已經實現了學習嗎？
機器人在訓練後是否獲得了智能？
討論監督學習法的概念。

延伸討論 :

機械人懂得沿着賽道移動嗎？為什麼機械人懂得沿着賽道移動呢？
對於這個實驗，輸入是甚麽？有多少個輸入（像素）？
輸岀是甚麽？有多少個輸出？
學習有沒有發生過？機械人是否獲取了智能？討論甚麽是監督式學習法。

總結 :

訓練重點：首先是教導機械人順利圍圈跑；不要接近紅色牆，不要接近黑色牆。轉彎時，行深一些，避開中間的黑色牆。
中階訓練：當機械人接近紅色牆時，懂得轉右走出來，避免撞紅牆。當機械人接近黑色牆時，懂得轉左走出來，避免撞黑牆。
高階訓練：撞到了紅色牆時，懂得走出來（轉右）。撞到了黑色牆時，懂得走路出來（轉左）。
死位訓練：當轉彎時，封死在黑牆的邊緣上，懂得轉出來。封死在角位上，懂得轉出來。
最後，將速度調教到一個平衡水平，快但不失控。