主螢幕 | MAIN SCREEN

主螢幕會顯示 Thymio 的狀態及其學習過程。

我們以 reinforcement learning 作例子 :

  1. 可以看到機器人的 sensor 被激活 , 被激活的 sensor 都是神經網絡的輸入。
  2. 神經網絡。你可以看到它實時的演變 (黃色/藍色 : 正/負數行動的傳輸 ; 綠色/紅色 : 學習過程中連接的增強或減弱) 。線的粗幼與連接的權重成正比。
  3. 機器人的可以進行的動作。神經網絡的輸出。你可以直接點擊它們(圖示)來控制機器人做你想要的行動。
  4. Reward (獎勵) : 機器人在強化學習時為每個動作獲得的分數(有正有負)
  5. Level (等級) : 最近2分鐘的平均獎勵