3a. 訓練識別可口可樂罐和Perrier瓶

學習目標 :

這單元將會為你介紹電腦視覺的基本概念。 電腦視覺是一種透過不同技術使機器能夠處理及分析真實世界的圖像,並將其轉化為機器能夠理解的 一項AI應用。因此,電腦視覺是AI應用的一種非常重要的輸入方法。 當你明白及理解電腦視覺這一工具,你就能夠輕鬆地及有趣地設計及完成很多的AI實驗了。

學習內容 :

  • 電腦視覺 (computer vision) 使機器能夠由數碼影像中獲取很有用的資訊,並且透過處理及分析這些資訊,能夠做出一些 決定。如果AI使到電腦能夠思考,電腦視覺就是使到機器能夠看見。
  • 電腦(機器)看一個數碼影像時, 影像是被切割成多個區。AlphAI 稱這些區為 “像素” (pixels)。你可以將 AlphAI 內的相機調校成不同的像素,例如 2x1,4x3, 8x6,36x24, 640x480, 等等。
  • 像素越大,機器將能夠更準確分辨到影像的形狀及仔細部份。但是,這樣做將會需要更多的電腦儲存位及更大的電腦處理器;是非常昂貴的。 
  • 影像可以是灰階的(黑白), 亦可以是彩色的。當影像是彩色時,AlphAI 需要用上三色系統去處理,輸入的數量就是灰階的三倍 了。 

所需準備 :

 
材料: Parameter 參數 :
“U03a Coke and Perrier.json”
Coke
Perrier

Sensor (Input)
傳感器
相機 32 x 24
  • 彩色的
Action (Output)
行動
Label : Coke , Perrier , None
AI Supervised Learning, Neural Network 監督學習,神經網絡
Visualization
可視化
OFF only <network value>; 僅<網絡值> Off

下載並導入 "U03a Coke Perrier"

訓練原理 :

根據機械人看到的物件選擇相應 Output ( Coke 或 Perrier ) ,

None 是背景作為對照組 , 建議為純色或簡單的背景不要過於雜亂。

注意你在測試分辨時應和訓練時保持同一背景 , 因為 Coke 及 Perrier 背後的背景也是訓練的一部份。

開始訓練 :

  • 點擊<重置學習>按鈕一次; 關閉<自動駕駛>按鈕
  • 點擊<學習>按鈕
  • 訓練機器人識別“None 無” - 即沒有物體,只有背景
  • 訓練機器人識別可口可樂罐
  • • 查看電腦屏幕上的攝像頭。
  • • 如果它被正確識別,請點擊您想要訓練機器人識別的正確輸出
  • • 等待直到厚黃色連接指向所需輸出。
  • • 所需輸出的輸出神經元也應該變成黃色,其值應該增加並變得最大。
  • • 使用相同的物體,將其稍微向左移動(或向右或向上或向下),並點擊正確分類的輸出。
  • 重複此步驟4-6次。
  • 對其他物體(例如Perrier瓶)進行上述訓練。

測試 :

  • 關閉<學習>按鈕。
  • 點擊<自動駕駛>按鈕。機器人將使用學習的智能來識別物體。
  • 使用沒有物體、可口可樂罐和Perrier瓶進行測試。
  • 結果是否正確?

如果結果不是100%正確,您可能需要重新訓練一些卡片。

討論 :

  • 您的訓練智能是否有效?
  • 這可以應用於其他領域嗎?

總結 :

  • 監督式學習法 (Supervised Learning) 是最流行的AI學習法。它可以和神經網絡配合使用,效果非常理想。 
  • 監督式學習法的核心概念是”模仿”。 它有兩個階段。第一個階段是 “訓練”,第二個階段是 “測試或應 用”。 
  • 在 “訓練”階段,當看到每一個輸入影像,機械人會 “模仿”訓練員的決定(相關的標籤輸出)。大量的訓練資料會被使用, 讓機械人觀看;同時,訓練員亦會對每一影像畫面,作出一 個決定。透過這樣的訓練,神經網絡內的有關數值會被修改,而神經網絡慢慢地就擁有 “模仿” 人類做決定的能力了。 
  • 在 “應用”階段,機械人就能夠對新的影像作出決定了。 

要點 :

  • 人工智能AI 是需要 “訓練”的。 
  • 監督式學習法 (Supervised Learning) 是人工智能AI的一種學習方法。 
  • 監督式學習法需要訓練資料(training data)。 
  • 訓練資料分別有输入的和對應每一個輸入相關的(標籤)輸出。 
  • 透過觀看每一個輸入影像及相關的輸出決定,機械人慢慢便學會 “模仿”訓練員的決定了。 
  • 如果要獲得高質數的人工智能 AI,是需要大量及非常準確的訓練資料的。