媒體
  • 澳廣視新聞
  • 政府消息
  • 濠江日報
  • 澳門日報
  • 力報
  • 新華澳報
  • 正報
  • 華僑報
  • 現代澳門日報
  • 論盡澳門
  • 澳門平台
  • Media OutReach
  • 美通社
分類
  • 澳聞
  • 經濟
  • 要聞
  • 體育
  • 藝海
新聞
  • 社保澄清非經援措施
  • 民慈會冀加快正常通關
  • 婦聯冀前瞻規劃口岸交通配套
  • 電力故障輕軌昨停運句鐘
  • 靜待轉機
  • 科學館復常受親子歡迎
  • 政府收回氹仔國有土地
  • 西門子橫琴德國城合建智慧園區
  • 善豐小業主攤分億七重建費
  • 鄭安庭倡放寬兩地牌車進出九市
  • 女子拾澳門通擅用就逮
  • 私家車撞毀“水馬”難逃“天眼”
  • 民眾建澳籲拆危窗迎風季
  • 甄逸全購鉅星匯疑享特權
  • 議員盼保障博企僱員度時艱
  • 市諮委關注舊區渠網設計
  • 澳宜持續補強維護國安
  • 與會者:港國安法守護疆土
  • 六旬婦快餐店吊頸亡
  • 男子墮點數卡陷阱失八千

過度擬合與不足擬合

2020-06-04 06:35


    過度擬合與不足擬合

    過度擬合(Overfitting)是指AI Model程式因從訓練數據中過度地充分學習或太仔細地記下一切,其得出的模式(pattern)因太仔細以至未能概括地(generalize)從訓練數據中得出較好的模式,故所得出的模式套在測試數據上就會產生較大落差,未能作出較準確預測。

    不足擬合(Underfitting)是指AI Model程式中所用的Model太過簡單,即其decision trees太少或未夠深,縱使有足夠的訓練數據,亦未能從訓練數據中充分學習,其得出的模式套在測試數據上,自然未能作出較準確的預測。(參考圖)

    因AI Model程式要兼顧很多特徵(features),用錯誤率(cartesian  error rate)來計算每個特徵較可行。當訓練數據錯誤率非常低,而測試數據錯誤率非常高時,即代表過度擬合,AI Model程式太複雜,會容易產生過度擬合,用簡單些的decision trees會改善。相反,當訓練數據錯誤率非常高,而測試數據錯誤率亦非常高,即代表不足擬合,AI Model程式內的decision trees太簡單,就會產生不足擬合,調教decision trees便會改善。唯有當訓練數據錯誤率非常低,而測試數據錯誤率亦非常低,即代表該AI Model程式做得不錯(balanced),其預測亦較可靠。(參考附圖)

    學勤進修教育中心電腦專科導師 周柏堅