S1. 機器人比賽 | Robot Race
引言 :
我們將利用監督式學習來訓練 AlphAI 繞著比賽場地行走,然後讓幾個 AlphAI 在同一條賽道上進行比賽。
知識 :
能夠使用 AlphAI 的視角,尤其是在選擇轉右還是轉左的時候!
材料 :
- 已經在電腦安裝 AlphAI software (每一隻 AlphAI 需一台電腦)
- 具備藍牙或Wi-Fi功能的電腦以和 AlphAI 進行溝通
- 擁有數隻 AlphAI 機器人
- 擁有足夠的材料建構比賽場地
設置比賽場地
建構你的比賽場地成一個可圍繞行駛的賽道。 我們推薦使用 Learning Robots Large Racing Arena 套件,但您也可以以其他材料來建構自己的賽道,只要確保地板和賽道邊緣之間有良好的視覺對比,還要確保地板保持乾淨。
訓練和使用
設定
→ 安裝 AlphAI software , 點擊「AlphAI」圖示以開啟軟件
→ 開啟 AlphAI 的電源 (電源掣在底部)。需時約20-30秒 , 它會輕輕移動幾步, 當它準備好連接時會亮起白光。
→ 記下 AlphAI 底板的編號 ( 應該3位數 e.g 197 )
→ 選擇以WiFi 或 藍牙接駁 ( 當超過4個 AlphAI 或房間已有多個 WiFi 網絡時 , 建議使用藍牙接駁)
Wi-Fi : | 藍牙 : |
---|---|
- 將電腦連接至 AlphAI 的 Wi-Fi :找出以 AlPHAI 開頭並以機械人編號結尾的 Wi-Fi 網絡 : 密碼與Wi-Fi名稱相同 (包括大小寫)- 在「Tools」工具欄中選擇「wifi」 | - 在 「Tools」工具欄中選擇「Bluetooth」,選擇相應的 AlphAI (對應機身編號)- 如果你的 AlphAI 不在列表中 , 點擊「pari a new robot via Bluetooth」並在該 AlphAI 出現時選擇 它 , 然後將它添加到您可以選擇的列表中。 |
→ 點擊「connection」 button 來連接你的 AlphAI 。連接後你將在右下角能到它的電量。
→ 在「Parameters」中選出「load demo parameters...」然後導入「Supervised learning - Navigation with camera (robot race)
訓練 (Remote Control)
取消勾選「self-drive」button , 這意味著機器人將由你完全控制。
通過單擊右側的箭頭或使用鍵盤上的方向鍵來控制機器人移動。 沒有快速前進的必要:目標是教機器人朝正確的方向移動,而不是撞到牆上。
(注意: 假如鍵盤的方各鍵不能運作 , 先在右面點擊箭頭再嘗試使用鍵盤)
提示 :
在訓練過程 , 不使行駛得太快 , 每次都花一點時間來選擇正確動作。
為方便學習,您可以:
用手移動機器人,教它在各種情況下做出正確動作。
遠離中心的障礙物,以免機器人在轉彎時卡在上面。
測試和加強學習
在賽場完成幾圈行駛後,如果您認為您的機器人已經訓練有素,你可以重新點擊 「self-drive」。 如果你的機器人訓練有素,它將開始自行跟隨訓練的內容行駛!
但學習過程還沒有結束的; 即使機器人是自動駕駛,你也可以在它移動時通過按箭頭繼續控制它(訓練)。 例如,如果機器人被卡在牆上並且不知道該怎麼做,可以通過要求它向後退來幫助它。
當機器人動作正常且始終如一時,請轉到 A.I. 保存網絡狀態並在要求保存內存時單擊是。 如果出現問題,這使您無需從頭開始就可以保存您的訓練。
當機器人動作正常且始終如一時,請轉到「 A.I.」工具標按「Save network」以保存網絡狀態並在要求保存時按「YES」。 儲存的好處是當出現問題時也不用由頭開始重做。
機器人比賽 | ROBOT RACE
訓練好機器人後,我們可以組織一場比賽:將參賽的機器人放在起跑線上。 所有參賽隊伍同時啟動「self-mode」自駕模式。 比賽期間,只允許使用自駕模式:參賽者不得對自己的機器人下達指令。 裁判可以負責移動被阻擋超過 5 秒的機器人,讓他們繼續比賽。
還有一些參數可以讓 AlphAI 更進步:
• 在 dashboard 控制面板的底部 , 可以調整機器人的最高速度。 速度越高,機器人移動的越快,但它也會以更高速度駛向障礙物。 所以設置非常高的速度可能一個絕對的優勢!
• 在左側的「actions」菜單中,您可以固定動作的持續時間(如果 parametes settings 處於初學者模式(beginner),則未能使用)。 這個持續時間越短,機器人就會越精確,就越容易控制,但如果太低,機器人每一步都幾乎不會移動,學習階段可能會很乏味。
總結 :
我們從正確的學習中觀察到機器人是可以自主行動的。然而它有必要繼續它的監督式學習,因為它會在未知情況下「即興發揮」 例如 : 機器人在學習期間都是獨自在賽道中進行訓練,如果有另一個機器人在它面前並擋住它,它將不知道如何行動。
該活動還說出儘管演算法相同,但學習效率或多或少會取決於提供給機器人的學習數據的質量。
讓我們討論什麼是好習數據集從而讓學習變得更好。
答案 :
- 學習數據的質量:在訓練間期減少錯誤
- 學習數據的數量
- 學習數據的詳盡性 : 機器人在面對未知情況時會犯更多的錯誤