F1 score,micro F1score,macro F1score 的定義

F1 score,micro F1score,macro F1score 的定義

本篇博客可能會繼續更新

最近在文獻中常常看到precesion,recall,經常忘記了他們的定義,在加上今天又看到評價多標籤分類任務性能的度量方法micro F1score和macro F2score。決定再把F1 score一併加進來把定義寫清楚,忘記了再來看看。php

F1score

F1score(如下簡稱F1)是用來評價二元分類器的度量,它的計算方法以下:
html

 


F1是用來衡量二維分類的,那形容多元分類器的性能用什麼呢?micro F1score,和macro F2score則是用來衡量多元分類器的性能。
node

 

假設對於一個多分類問題,有三個類,分別記爲一、二、3,markdown

TPi是指分類i的True Positive;
FPi是指分類i的False Positive;
TNi是指分類i的True Negative;
FNi是指分類i的False Negative。app

咱們分別計算每一個類的精度(precision)
post


macro 精度 就是全部分類的精度平均值
性能


一樣,每一個類的recall計算爲
spa


macro 召回就是全部分類的召回平均值
.net


套用F1score的計算方法,macro F1score就是
xml

micro F1score

假設對於一個多分類問題,有三個類,分別記爲一、二、3,

TPi是指分類i的True Positive;
FPi是指分類i的False Positive;
TNi是指分類i的True Negative;
FNi是指分類i的False Negative。
接下來,咱們來算micro precision


相應的micro recall則是


則micro F1score爲

總結

若是各個類的分佈不均衡的話,使用micro F1score比macro F1score 比較好,顯然macro F1score沒有考慮各個類的數量大小

參考
該網址一位答主的回答,我搬運過來

相關文章
相關標籤/搜索