有多種方法可以討論為什么混淆矩陣在機(jī)器學(xué)習(xí)(ML) 中很有價(jià)值,但最簡(jiǎn)單的方法之一是解釋混淆矩陣是一種數(shù)據(jù)可視化資源。
混淆矩陣使查看者能夠一目了然地看到使用分類器或其他算法的結(jié)果。通過(guò)使用簡(jiǎn)單的表格來(lái)顯示分析結(jié)果,混淆矩陣本質(zhì)上將您的輸出歸結(jié)為更易于理解的視圖。
混淆矩陣使用特定的術(shù)語(yǔ)來(lái)排列結(jié)果。有真陽(yáng)性和真陰性,也有假陽(yáng)性和假陰性。對(duì)于更復(fù)雜的混淆矩陣或基于比較分類的混淆矩陣,這些值可能顯示為兩個(gè)不同對(duì)象的實(shí)際類別和預(yù)測(cè)類別。
無(wú)論語(yǔ)義術(shù)語(yǔ)如何,結(jié)果都會(huì)分組到正方形(或矩形)表中。
此視圖使分析師可以更輕松地了解算法對(duì)結(jié)果進(jìn)行分類的準(zhǔn)確性。(閱讀New Generators Put Modern Algorithms to Work on ASCII Art。)
混淆矩陣的實(shí)用性與機(jī)器學(xué)習(xí)項(xiàng)目的復(fù)雜性有關(guān),也與信息格式化和交付給用戶的方式有關(guān)。想象一串線性結(jié)果,包括假陽(yáng)性、假陰性、真陽(yáng)??性和真陰性。(閱讀機(jī)器學(xué)習(xí) 101。)
用戶必須將所有這些線性結(jié)果制成圖表,才能了解算法的工作原理及其準(zhǔn)確性。通過(guò)混淆矩陣,這些信息可以簡(jiǎn)單地以強(qiáng)大的視覺(jué)模型呈現(xiàn)。
例如,假設(shè)機(jī)器被要求對(duì) 20 張圖像進(jìn)行分類,其中 5 個(gè)是水果,5 個(gè)是蔬菜。如果混淆矩陣包含以下內(nèi)容(從左上角順時(shí)針開(kāi)始):7、5、3、5,則該矩陣顯示 7 種被正確識(shí)別為蔬菜,而 3 種被正確分類為水果。
如圖所示,另外 10 個(gè)是程序無(wú)法正確識(shí)別圖像的結(jié)果。
混淆矩陣在各種機(jī)器學(xué)習(xí)分析中都很有用。通過(guò)觀察此資源,用戶可以弄清楚如何處理維度和過(guò)度擬合等問(wèn)題,以及優(yōu)化算法的其他方法。
上一篇我們送上的文章是
機(jī)器學(xué)習(xí)專業(yè)人士如何使用結(jié)構(gòu)化預(yù)測(cè)? , _!在下一篇繼續(xù)做詳細(xì)介紹,如需了解更多,請(qǐng)持續(xù)關(guān)注。
本文由
日本NEC鋰電池中國(guó)營(yíng)銷中心于2023-07-16 17:41:01 整理發(fā)布。
轉(zhuǎn)載請(qǐng)注明出處.