Remove ads
Tabela de contingência 2x2 de onde se avalia performance de um classificador Da Wikipédia, a enciclopédia livre
No campo do Aprendizado de Máquina uma matriz de confusão é uma tabela que permite a visualização do desempenho de um algoritmo de classificação [1] .
Verdade | ||||||
População total | Condição positiva | Condição negativa | Prevalência = Σ Condição positivaΣ População total | Acurácia (ACC) = Σ Verdadeiro positivo + Σ Verdadeiro negativo Σ População total | ||
Predito |
Condição positiva prevista |
Verdadeiro positivo | Falso positivo, Erro do tipo I |
Valor preditivo positivo (PPV), Precisão = Σ Verdadeiro PositivoΣ Condição positiva prevista | Taxa de falsa descoberta (FDR) = Σ Falso positivoΣ Condição positiva prevista | |
Condição negativa prevista |
Falso negativo, Erro do tipo II |
Verdadeiro negativo | Taxa de Falsa Omissão (FOR) = Σ Falso negativoΣ Condição negativa prevista | Valor preditivo negativo (NPV) = Σ Verdadeiro negativoΣ Condição negativa prevista | ||
Taxa de Verdadeiro Positivo (TPR), Revocação, Sensibilidade, probabilidade de detecção, Potência = Σ Verdadeiro positivoΣ Condição positiva | Taxa de Falso Positivo (FPR), Fall-out, probabilidade de alarme falso = Σ Falso positivoΣ Condição negativa | Teste da razão de verossimilhança positiva (LR+) = TPRFPR | Razão de possibilidades de diagnóstico (DOR) = LR+LR− | F1 score = 2 · Precisão · RevocaçãoPrecisão + Revocação | ||
Taxa de Falso Negativo (FNR), Taxa de perda = Σ Falso negativoΣ Condição positiva | Especificidade (SPC), Seletividade, Taxa de Verdadeiro Negativo (TNR) = Σ Verdadeiro negativoΣ Condição negativa | Teste da razão de verossimilhança negativa (LR−) = FNRTNR |
Essa tabela de contingência 2x2 especial é também chamada de matriz de erro[2]. Cada linha da matriz representa instâncias de uma classe prevista enquanto cada coluna representa instâncias da classe real (ou vice versa)[3]. O nome vem do fato que é fácil ver se o sistema está confundindo as duas classes (chamando uma classe como a outra).
É um tipo especial de tabela de contingência, com duas dimensões ("real" e "prevista"), e conjuntos de "classes" idênticos em ambas as dimensões (cada combinação das dimensões e classe é uma variável na tabela de contingência).
Dada uma amostra de 13 fotos, 8 de gatos e 5 de cachorros, onde os gatos pertencem à classe 1 e os cães pertencem à classe 0,
Suponha que um classificador que distingue entre cachorros e gatos seja treinado. Das 13 fotos examinadas, o classificador faz 8 previsões precisas e erra 5, sendo que 3 gatos são erroneamente previstos como cachorros (primeiras 3 previsões) e 2 cachorros são erroneamente previstos como gatos (últimas 2 previsões).
Com esses dois conjuntos rotulados (reais e previsões), podemos criar uma matriz de confusão que resumirá os resultados do teste do classificador:
|
Nessa matriz de confusão, das 8 fotos de gatos, o sistema avaliou que 3 eram cachorros e, das 5 fotos de cachorros, previu que 2 eram gatos. Todas as previsões corretas estão localizadas na diagonal da tabela (destacada em negrito), portanto, é fácil inspecionar visualmente a tabela em busca de erros de previsão, pois eles serão representados por valores fora da diagonal. Em termos abstratos, a matriz de confusão é a seguinte:
|
Onde: P = Positivo; N = Negativo; VP = Verdadeiro Positivo; FP = Falso Positivo; VN = Verdadeiro Negativo; FN = Falso Negativo.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.