S1. 機器人比賽 | Robot Race

引言 :

我們將利用監督式學習來訓練 AlphAI 繞著比賽場地行走,然後讓幾個 AlphAI 在同一條賽道上進行比賽。

知識 :

能夠使用 AlphAI 的視角,尤其是在選擇轉右還是轉左的時候!

材料 :

  • 已經在電腦安裝 AlphAI software (每一隻 AlphAI 需一台電腦)
  • 具備藍牙或Wi-Fi功能的電腦以和 AlphAI 進行溝通
  • 擁有數隻 AlphAI 機器人
  • 擁有足夠的材料建構比賽場地

設置比賽場地

建構你的比賽場地成一個可圍繞行駛的賽道。 我們推薦使用 Learning Robots Large Racing Arena 套件,但您也可以以其他材料來建構自己的賽道,只要確保地板和賽道邊緣之間有良好的視覺對比,還要確保地板保持乾淨。

訓練和使用

設定

→ 安裝 AlphAI software , 點擊「AlphAI」圖示以開啟軟件

→ 開啟 AlphAI 的電源 (電源掣在底部)。需時約20-30秒 , 它會輕輕移動幾步, 當它準備好連接時會亮起白光。

→ 記下 AlphAI 底板的編號 ( 應該3位數 e.g 197 )

→ 選擇以WiFi 或 藍牙接駁 ( 當超過4個 AlphAI 或房間已有多個 WiFi 網絡時 , 建議使用藍牙接駁)

Wi-Fi : 藍牙 :
- 將電腦連接至 AlphAI 的 Wi-Fi :找出以 AlPHAI 開頭並以機械人編號結尾的 Wi-Fi 網絡 : 密碼與Wi-Fi名稱相同 (包括大小寫)- 在「Tools」工具欄中選擇「wifi」 - 在 「Tools」工具欄中選擇「Bluetooth」,選擇相應的 AlphAI (對應機身編號)- 如果你的 AlphAI 不在列表中 , 點擊「pari a new robot via Bluetooth」並在該 AlphAI 出現時選擇 它 , 然後將它添加到您可以選擇的列表中。

→ 點擊「connection」 button 來連接你的 AlphAI 。連接後你將在右下角能到它的電量。

→ 在「Parameters」中選出「load demo parameters...」然後導入「Supervised learning - Navigation with camera (robot race)

訓練 (Remote Control)

取消勾選「self-drive」button , 這意味著機器人將由你完全控制。

通過單擊右側的箭頭或使用鍵盤上的方向鍵來控制機器人移動。 沒有快速前進的必要:目標是教機器人朝正確的方向移動,而不是撞到牆上。

(注意: 假如鍵盤的方各鍵不能運作 , 先在右面點擊箭頭再嘗試使用鍵盤)

提示 :

在訓練過程 , 不使行駛得太快 , 每次都花一點時間來選擇正確動作。

為方便學習,您可以:

用手移動機器人,教它在各種情況下做出正確動作。

遠離中心的障礙物,以免機器人在轉彎時卡在上面。

測試和加強學習

在賽場完成幾圈行駛後,如果您認為您的機器人已經訓練有素,你可以重新點擊 「self-drive」。 如果你的機器人訓練有素,它將開始自行跟隨訓練的內容行駛!

但學習過程還沒有結束的; 即使機器人是自動駕駛,你也可以在它移動時通過按箭頭繼續控制它(訓練)。 例如,如果機器人被卡在牆上並且不知道該怎麼做,可以通過要求它向後退來幫助它。

當機器人動作正常且始終如一時,請轉到 A.I. 保存網絡狀態並在要求保存內存時單擊是。 如果出現問題,這使您無需從頭開始就可以保存您的訓練。

當機器人動作正常且始終如一時,請轉到「 A.I.」工具標按「Save network」以保存網絡狀態並在要求保存時按「YES」。 儲存的好處是當出現問題時也不用由頭開始重做。

機器人比賽 | ROBOT RACE

訓練好機器人後,我們可以組織一場比賽:將參賽的機器人放在起跑線上。 所有參賽隊伍同時啟動「self-mode」自駕模式。 比賽期間,只允許使用自駕模式:參賽者不得對自己的機器人下達指令。 裁判可以負責移動被阻擋超過 5 秒的機器人,讓他們繼續比賽。

還有一些參數可以讓 AlphAI 更進步:

• 在 dashboard 控制面板的底部 , 可以調整機器人的最高速度。 速度越高,機器人移動的越快,但它也會以更高速度駛向障礙物。 所以設置非常高的速度可能一個絕對的優勢!

• 在左側的「actions」菜單中,您可以固定動作的持續時間(如果 parametes settings 處於初學者模式(beginner),則未能使用)。 這個持續時間越短,機器人就會越精確,就越容易控制,但如果太低,機器人每一步都幾乎不會移動,學習階段可能會很乏味。

總結 :

我們從正確的學習中觀察到機器人是可以自主行動的。然而它有必要繼續它的監督式學習,因為它會在未知情況下「即興發揮」 例如 : 機器人在學習期間都是獨自在賽道中進行訓練,如果有另一個機器人在它面前並擋住它,它將不知道如何行動。

該活動還說出儘管演算法相同,但學習效率或多或少會取決於提供給機器人的學習數據的質量。

讓我們討論什麼是好習數據集從而讓學習變得更好。

答案 : 

  • 學習數據的質量:在訓練間期減少錯誤
  • 學習數據的數量
  • 學習數據的詳盡性 : 機器人在面對未知情況時會犯更多的錯誤