Loading AI tools
来自维基百科,自由的百科全书
F值,亦被称做F-measure,是一种量测算法的精确度常用的指标,经常用来判断演算法的精确度。目前在辨识、侦测相关的演算法中经常会分别提到精确率(precision)和召回率(recall),F-score能同时考虑这两个数值,平衡地反映这个演算法的精确度。
是使用者自行定义的参数,由一般式可见F-score能同时考虑precision和recall这两种数值。分子为precision和recall相乘,根据这个式子,只要precision或recall趋近于0,F-score就会趋近于0,代表著这个演算法的精确度非常低。一个好的演算法,最好能够平衡recall和precision,且尽量让两种指标都很高。所以有一套判断方式可以同时考虑recall和precision。当时,F-score退化为precision;当时,F-score退化为recall。
一般上来说,提到F-score且没有特别的定义时,是指时的F-score,亦有写作F1-score。代表使用者同样的注重precision和recall的这两个指标。其分数可以说是precision和recall的调和平均,式子如下:
F-score最理想的数值是趋近于1,做法是让precision和recall都有很高的值。若两者皆为1,使得,则F-score = 1 (100%),代表该算法有著最佳的精确度。
前面的true/false修饰后面的positive/negative,后面的positive/negative是我们的方法的判断。
以抓犯人为例,TP是有罪而且被抓到的情形,FN是有罪但没被抓到的情形,FP是无罪但被误抓的情形,TN是无罪且未被误逮的情形
判断为真 | 判断不为真 | |
---|---|---|
事实上为真 | TP | FN |
事实上不为真 | FP | TN |
(positive prediction rate)
Precision的分母为两种判断为真的情形的总和(范恩图中完整绿色的部份)
Recall的分母为事实上为真的情形的总和(范恩图中完整紫色的部份)
以警察抓犯人的故事为例:
一位警察很厉害,抓了很多犯人,但是这些犯人当中,只有少部分真正有罪,其他都是被冤枉的。
一个警察非常严谨,只逮捕真正有犯罪的人,不抓实在是没办法肯定的犯人。
F-score经常用于评估资讯检索的结果,如:
F-score 是等于取回物品集和相关物品集的Dice系数
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.