Clasificación de documentos
De Wikipedia, la enciclopedia encyclopedia
Se define como la tarea de asignar valores booleanos a cada par pertenecientes a
, donde
es el dominio de los documentos y
es una colección de categorías predefinidas. T (verdadero) indica archivar un documento
bajo
, mientras F (falso) indica no archivar
bajo
.
Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam)
Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.[1]