Coding and STEM

單元四：簡介監督式學習 (Supervised Learning)

學習目標

在這單元，會為大家介紹監督式學習法。監督式學習法是人工智能其中一種最為廣泛應用的學習法。

透過訓練機械人參加競賽，我們會學習及練習監督式學習法。活動要求大家訓練機械人沿着賽道內側圍圈跑。

學習內容

監督式學習法是最流行的AI學習法。它可以和神經網絡配合使用，效果非常理想。

監督式學習法的核心概念是”模仿”。它有兩個階段。第一個階段是 “訓練”，第二個階段是 “測試或應用”。

在 “訓練”階段，當看到每一個輸入影像，機械人會 “模仿”訓練員的決定。大量的訓練資料會被使用，例如大量賽道𥚃的影像會用作輸入資訊，讓機械人觀看；同時，訓練員亦會對每一影像畫面，作出一個移動的決定。透過這樣的訓練，神經網絡內的有關數值會被修改，而神經網絡慢慢地就擁有 “模仿”人類做決定的能力了。

在 “應用”階段，機械人就能夠對新的影像作出移動的決定了。

總結

人工智能AI 是需要 “訓練”的。
監督式學習法是人工智能AI的一種學習方法。
監督式學習法需要大量的訓練資料。
訓練資料分別有输入的和對應每一個輸入相關的（標籤）輸出。
透過觀看每一個輸入影像及相關的輸出決定，機械人慢慢便學會 “模仿”訓練員的決定了。
如果要獲得高質數的人工智能 AI，是需要大量及非常準確的訓練資料的。

活動 - 機械人競賽 - 訓練機械人去參加比賽

材料:

AlphAI 長方形的競賽跑道

AI 設置參數

如下圖，揀選 <Parameters> 下的 “Load demo parameters…”
再揀選 “Robot Race”

開始活動

啓動AlphAI 機械人及聯線到你的電腦。需要時按螢光幕上的”聯線” <Connection> 按鈕。
如果設定參數正確，螢光幕將會顯示以下的神經網絡。

標籤輸出

根據動作解。

訓練

啓動 “重設學習” <reset learning> 按鈕。
關閉 “自動駕駛” <self drive> 按鈕。
啓動 “學習” <learning> 按鈕。

將機械人放在賽道的起跑線上。
根據賽道情況：
- 點擊右邊的移動箭嘴，讓機械人懂得沿着賽道行走。
- 應該盡量不要撞牆，以最短距離完成每一圈。
- 重覆 2至3 圈的訓練。
關閉 “學習” <learning> 按鈕。代表學習已經完成。

測試

將機械人放在賽道的起跑線。
啓動 “自我駕駛” <self drive> 按鈕。

測試機械人是否已經可以參加比賽。
如果有需要，重新啓動 “學習”按鈕，增加訓練。

**滿意後，可以和其他 2至4 個機械人比賽。

討論

機械人懂得沿着賽道移動嗎？為什麼機械人懂得沿着賽道移動呢？
對於這個實驗，輸入是甚麽？有多少個輸入（像素）？
輸岀是甚麽？有多少個輸出？
學習有沒有發生過？機械人是否獲取了智能？
討論甚麽是監督式學習法。