單元四:簡介監督式學習 (Supervised Learning)
學習目標
在這單元,會為大家介紹監督式學習法。監督式學習法是人工智能其中一種最為廣泛應用的學習法。
透過訓練機械人參加競賽,我們會學習及練習監督式學習法。活動要求大家訓練機械人沿着賽道內側圍圈跑。
學習內容
監督式學習法是最流行的AI學習法。它可以和神經網絡配合使用,效果非常理想。
監督式學習法的核心概念是”模仿”。 它有兩個階段。第一個階段是 “訓練”,第二個階段是 “測試或應用”。
在 “訓練”階段,當看到每一個輸入影像,機械人會 “模仿”訓練員的決定。大量的訓練資料會被使用,例如大量賽道𥚃的影像會用作輸入資訊,讓機械人觀看;同時,訓練員亦會對每一影像畫面,作出一個移動的決定。透過這樣的訓練,神經網絡內的有關數值會被修改,而神經網絡慢慢地就擁有 “模仿”人類做決定的能力了。
在 “應用”階段,機械人就能夠對新的影像作出移動的決定了。
總結
- 人工智能AI 是需要 “訓練”的。
- 監督式學習法是人工智能AI的一種學習方法。
- 監督式學習法需要大量的訓練資料。
- 訓練資料分別有输入的和對應每一個輸入相關的(標籤)輸出。
- 透過觀看每一個輸入影像及相關的輸出決定,機械人慢慢便學會 “模仿”訓練員的決定了。
- 如果要獲得高質數的人工智能 AI,是需要大量及非常準確的訓練資料的。
活動 - 機械人競賽 - 訓練機械人去參加比賽
材料:
AlphAI 長方形的競賽跑道
AI 設置參數
- 如下圖,揀選 <Parameters> 下的 “Load demo parameters…”
- 再揀選 “Robot Race”
開始活動
- 啓動AlphAI 機械人及聯線到你的電腦。需要時按螢光幕上的”聯線” <Connection> 按鈕。
- 如果設定參數正確,螢光幕將會顯示以下的神經網絡。
標籤輸出
- 根據動作解。
訓練
- 啓動 “重設學習” <reset learning> 按鈕。
- 關閉 “自動駕駛” <self drive> 按鈕。
- 啓動 “學習” <learning> 按鈕。
- 將機械人放在賽道的起跑線上。
- 根據賽道情況:
- 點擊右邊的移動箭嘴,讓機械人懂得沿着賽道行走。
- 應該盡量不要撞牆,以最短距離完成每一圈。
- 重覆 2至3 圈的訓練。
- 關閉 “學習” <learning> 按鈕。代表學習已經完成。
測試
- 將機械人放在賽道的起跑線。
- 啓動 “自我駕駛” <self drive> 按鈕。
- 測試 機械人是否已經可以參加比賽。
- 如果有需要,重新啓動 “學習”按鈕,增加訓練。
**滿意後,可以和其他 2至4 個機械人比賽。
討論
- 機械人懂得沿着賽道移動嗎? 為什麼機械人懂得沿着賽道移動呢?
- 對於這個實驗,輸入是甚麽?有多少個輸入(像素)?
- 輸岀是甚麽?有多少個輸出?
- 學習有沒有發生過?機械人是否獲取了智能?
- 討論甚麽是監督式學習法。