最近在文獻中常常看到precesion,recall,經常忘記了他們的定義,在加上今天又看到評價多標籤分類任務性能的度量方法micro F1score和macro F2score。決定再把F1 score一併加進來把定義寫清楚,忘記了再來看看。php
F1score(如下簡稱F1)是用來評價二元分類器的度量,它的計算方法以下:html
F1是用來衡量二維分類的,那形容多元分類器的性能用什麼呢?micro F1score,和macro F2score則是用來衡量多元分類器的性能。node
假設對於一個多分類問題,有三個類,分別記爲一、二、3,markdown
TPi是指分類i的True Positive;
FPi是指分類i的False Positive;
TNi是指分類i的True Negative;
FNi是指分類i的False Negative。app
咱們分別計算每一個類的精度(precision)post
macro 精度 就是全部分類的精度平均值性能
一樣,每一個類的recall計算爲