A.I 視窗 | A.I. WINDOW

A.I. 視窗能選擇怎樣訓練機器人 , 特別從監督式學習及強化學習(Deep Q learning)中作選擇。它還可以替不同演算法改變/設置參數。

Learning type :

選擇學習的方式 , 一般來說會是由監督式學習和強化學習之間作選擇。

演算法 | Algorithm :

選擇所使用的演算法。不同的學習能選擇的演算法都會有所不同!

監督式學習可選擇神經網絡(neural network)及 KNN 演算法 ;  強化學習可選擇 basic Q-learning 及 deep Q-learning (用作解釋神經網絡)。

優化器 | Optimizer (只會在監督式學習出現) :

利用優化演算法來改善神經網絡。

學習速率 | Learning rate (KNN沒有):

提高來加快學習 , 但如果出現分歧錯誤便會降低速度。

Gamma (只出現在強化學習):

調整給予即時獎勵的重要性(數值接近 0 )與需時更多的時間獎勵(數值接近 1 )

探索 | Exploration mode 及 exploration  (只出現在強化學習):

Exploration (探索) 的作用是在強化學習中探索新的行動以讓學習更完善。MODE 分為 「epsilon-greedy」及「soft-max」, exploration 則是進行探索的頻率 (數值為0至1)

隱藏的神經元層 | Hidden layers of neurons :

在「隱藏層」的神經元數量 , 例如 : 在「hidden neruon layers」中什麼都不輸入 , 以及在此輸入「50 , 100」。

前者代表沒有隱藏層 , 後者則代表有2層中間層(第1層有50個神經元 , 第2層有100個神經元)。

卷積層 | Convolutional layers :

卷積神經元層的配置 : 每一層由3個參數定義 : 內核數(number of kernels)、濾波器大小(filter size)和步幅(stride)(i.e.圖像大小是縮減的因子)。層的參數由 «/» 分隔 , 層則由逗號 «,» 分隔。例如 : «4/5/2, 8/5/2» 有2層 , 第一層有4個 kernels , 第2層則有 8個 kernels , 兩者的 filter size 都為 5 而 stride 是2。在鏡頭上選取某區間的 pixel。

2個神經元為1個2進制數值 | 2 neurons per binary value :

檢查是否有 2 個神經元用於真或假輸入(一個以及唯一一個將被激活) ; 取消勾選以只使用一個神經元。

正則化 | Regularization :

Regularization 只能輸入 0 - 1 的數字 , 數字代表連接的強度(intensity) , 數字愈大 Intensity 愈高。

當你調高數字時 , dashboard 上神經網絡的連接會閃爍得愈快 ; 由於閃爍的速度很快效能不高的電腦有機會導致程式崩潰 !

神經元是有偏差的 | Neurons have bias :

只會在監督式學習中的 neutral network 出現 , 啟用以讓神經元可以調整它的激活閾值(activation threshold) , 這代表所有神經元都會接收一個可調整的固定輸入 ; 「Neurons have bias 」並不會在 dashboard 上顯示出來/看到它對神經元的改變。

經驗緩衝 | Experience buffer (只出現在強化習) :

啟用以讓 AI 可以從過往的行動及獎勵中繼續學習。