泛化能力
在計算機系統(tǒng)中,“經驗”通常以數(shù)據(jù)的形式存在,因此機器學習所研究的主要內容是通過這些數(shù)據(jù)產生“模型”(model)。從數(shù)據(jù)產生模型的過程我們稱之為“訓練”(training),訓練過程中使用的數(shù)據(jù)稱為“訓練數(shù)據(jù)”。我們訓練得到模型后需要對模型進行評估。我們通常把分類錯誤的樣本數(shù)占總數(shù)的比例稱為“錯誤率”(error rate)。更一般的,我們把模型實際預測的輸出與真實的輸出之間的差異稱之為“誤差”(error)。機器學習的目標是使得訓練出的模型很好的適用于未見樣本。訓練出的模型適用于新樣本的能力,稱為“泛化能力”(generalization ability)。具有較強泛化能力的模型不僅在訓練數(shù)據(jù)上有好的表現(xiàn),還能夠很好的適用于整個樣本空間。通常我們假設所有的樣本都服從一個未知的分布,我們的訓練數(shù)據(jù)中每個樣本都是從這個分布上獨立的采集的,即“獨立同分布”(independent and identically distributed)。一般來說,訓練數(shù)據(jù)越多,我們可以得到的關于這個分布的信息越多,也就越有可能通過訓練得到具有較強泛化能力的模型。
免責聲明:本站詞條系由網友創(chuàng)建、編輯和維護,內容僅供參考。
以上內容均為商業(yè)內容展示,僅供參考,不具備專業(yè)問題解決服務,
如果您需要解決具體問題(尤其在法律、醫(yī)學等領域),建議您咨詢相關領域的專業(yè)人士。
如您發(fā)現(xiàn)詞條內容涉嫌侵權,請通過 948026894@qq.com 與我們聯(lián)系進行刪除處理!