Matriz de confusão

Tabela de contingência 2x2 de onde se avalia performance de um classificador Da Wikipédia, a enciclopédia livre

No campo do Aprendizado de Máquina uma matriz de confusão é uma tabela que permite a visualização do desempenho de um algoritmo de classificação [1] .


Verdade
População total Condição positiva Condição negativa Prevalência = Σ Condição positiva/Σ População total Acurácia (ACC) = Σ Verdadeiro positivo + Σ Verdadeiro negativo/Σ População total
Predito
Condição positiva
prevista
Verdadeiro positivo Falso positivo,
Erro do tipo I
Valor preditivo positivo (PPV), Precisão = Σ Verdadeiro Positivo/Σ Condição positiva prevista Taxa de falsa descoberta (FDR) = Σ Falso positivo/Σ Condição positiva prevista
Condição negativa
prevista
Falso negativo,
Erro do tipo II
Verdadeiro negativo Taxa de Falsa Omissão (FOR) = Σ Falso negativo/Σ Condição negativa prevista Valor preditivo negativo (NPV) = Σ Verdadeiro negativo/Σ Condição negativa prevista
Taxa de Verdadeiro Positivo (TPR), Revocação, Sensibilidade, probabilidade de detecção, Potência = Σ Verdadeiro positivo/Σ Condição positiva Taxa de Falso Positivo (FPR), Fall-out, probabilidade de alarme falso = Σ Falso positivo/Σ Condição negativa Teste da razão de verossimilhança positiva (LR+) = TPR/FPR Razão de possibilidades de diagnóstico (DOR) = LR+/LR− F1 score = 2 · Precisão · Revocação/Precisão + Revocação
Taxa de Falso Negativo (FNR), Taxa de perda = Σ Falso negativo/Σ Condição positiva Especificidade (SPC), Seletividade, Taxa de Verdadeiro Negativo (TNR) = Σ Verdadeiro negativo/Σ Condição negativa Teste da razão de verossimilhança negativa (LR−) = FNR/TNR


Essa tabela de contingência 2x2 especial é também chamada de matriz de erro[2]. Cada linha da matriz representa instâncias de uma classe prevista enquanto cada coluna representa instâncias da classe real (ou vice versa)[3]. O nome vem do fato que é fácil ver se o sistema está confundindo as duas classes (chamando uma classe como a outra).

É um tipo especial de tabela de contingência, com duas dimensões ("real" e "prevista"), e conjuntos de "classes" idênticos em ambas as dimensões (cada combinação das dimensões e classe é uma variável na tabela de contingência).

Exemplo

Resumir
Perspectiva

Dada uma amostra de 13 fotos, 8 de gatos e 5 de cachorros, onde os gatos pertencem à classe 1 e os cães pertencem à classe 0,

Dados reais = [1,1,1,1,1,1,1,1,0,0,0,0,0],

Suponha que um classificador que distingue entre cachorros e gatos seja treinado. Das 13 fotos examinadas, o classificador faz 8 previsões precisas e erra 5, sendo que 3 gatos são erroneamente previstos como cachorros (primeiras 3 previsões) e 2 cachorros são erroneamente previstos como gatos (últimas 2 previsões).

predição = [0,0,0,1,1,1,1,1,0,0,0,1,1]

Com esses dois conjuntos rotulados (reais e previsões), podemos criar uma matriz de confusão que resumirá os resultados do teste do classificador:

Mais informação Classificação real, Gato ...
Classificação real
Gato Cachorro
Classificação
prevista
Gato 5 2
Cachorro 3 3
Fechar

Nessa matriz de confusão, das 8 fotos de gatos, o sistema avaliou que 3 eram cachorros e, das 5 fotos de cachorros, previu que 2 eram gatos. Todas as previsões corretas estão localizadas na diagonal da tabela (destacada em negrito), portanto, é fácil inspecionar visualmente a tabela em busca de erros de previsão, pois eles serão representados por valores fora da diagonal. Em termos abstratos, a matriz de confusão é a seguinte:

Mais informação Classificação real, P ...
Classificação real
P N
Classificação
prevista
P VP FP
N FN VN
Fechar

Onde: P = Positivo; N = Negativo; VP = Verdadeiro Positivo; FP = Falso Positivo; VN = Verdadeiro Negativo; FN = Falso Negativo.

Matriz de Confusão

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.