單元四:簡介監督式學習 (Supervised Learning)

學習目標

在這單元,會為大家介紹監督式學習法。監督式學習法是人工智能其中一種最為廣泛應用的學習法。

透過訓練機械人參加競賽,我們會學習及練習監督式學習法。活動要求大家訓練機械人沿着賽道內側圍圈跑。

學習內容

監督式學習法是最流行的AI學習法。它可以和神經網絡配合使用,效果非常理想。

監督式學習法的核心概念是”模仿”。 它有兩個階段。第一個階段是 “訓練”,第二個階段是 “測試或應用”。

在 “訓練”階段,當看到每一個輸入影像,機械人會 “模仿”訓練員的決定。大量的訓練資料會被使用,例如大量賽道𥚃的影像會用作輸入資訊,讓機械人觀看;同時,訓練員亦會對每一影像畫面,作出一個移動的決定。透過這樣的訓練,神經網絡內的有關數值會被修改,而神經網絡慢慢地就擁有 “模仿”人類做決定的能力了。

在 “應用”階段,機械人就能夠對新的影像作出移動的決定了。

總結

  1. 人工智能AI 是需要 “訓練”的。
  2. 監督式學習法是人工智能AI的一種學習方法。
  3. 監督式學習法需要大量的訓練資料。
  4. 訓練資料分別有输入的和對應每一個輸入相關的(標籤)輸出。
  5. 透過觀看每一個輸入影像及相關的輸出決定,機械人慢慢便學會 “模仿”訓練員的決定了。
  6. 如果要獲得高質數的人工智能 AI,是需要大量及非常準確的訓練資料的。

 

活動 - 機械人競賽 - 訓練機械人去參加比賽

材料:

AlphAI 長方形的競賽跑道

 

 

AI 設置參數

  • 如下圖,揀選 <Parameters> 下的 “Load demo parameters…”
  • 再揀選 “Robot Race”

開始活動

  • 啓動AlphAI 機械人及聯線到你的電腦。需要時按螢光幕上的”聯線” <Connection> 按鈕。
  • 如果設定參數正確,螢光幕將會顯示以下的神經網絡。

 

標籤輸出

  • 根據動作解。

訓練

  • 啓動 “重設學習” <reset learning> 按鈕。
  • 關閉 “自動駕駛” <self drive> 按鈕。
  • 啓動 “學習” <learning> 按鈕。

 

  • 將機械人放在賽道的起跑線上。
  • 根據賽道情況:
    • 點擊右邊的移動箭嘴,讓機械人懂得沿着賽道行走。
    • 應該盡量不要撞牆,以最短距離完成每一圈。
    • 重覆 2至3 圈的訓練。
  • 關閉 “學習” <learning> 按鈕。代表學習已經完成。

 

測試

  • 將機械人放在賽道的起跑線。
  • 啓動 “自我駕駛” <self drive> 按鈕。

 

  • 測試 機械人是否已經可以參加比賽。
  • 如果有需要,重新啓動 “學習”按鈕,增加訓練。

 **滿意後,可以和其他 2至4 個機械人比賽。

 

討論

  • 機械人懂得沿着賽道移動嗎? 為什麼機械人懂得沿着賽道移動呢?
  • 對於這個實驗,輸入是甚麽?有多少個輸入(像素)?
  • 輸岀是甚麽?有多少個輸出?
  • 學習有沒有發生過?機械人是否獲取了智能?
  • 討論甚麽是監督式學習法。