Training e test set

Nell'apprendimento automatico^[1] un training set (in italiano insieme di addestramento o insieme di stima) è un insieme di esempi (spesso rappresentati come vettori di valori di attributi discreti o continui, le variabili di input) ad ognuno dei quali è associata una risposta, il valore di un attributo-obiettivo, ossia un valore categorico, cioè una classe, o un valore numerico. Tali esempi vengono utilizzati per addestrare un modello predittivo supervisionato (tipicamente un classificatore o un regressore) capace di determinare il valore-obiettivo per nuovi esempi. Un modello addestrato può essere valutato su un nuovo insieme di esempi, il test set (in italiano insieme di verifica), non utilizzati in fase di addestramento.

È comune dividere il training set in una parte dedicata all'addestramento dell'algoritmo, detta propriamente training set e una parte dedicata alla verifica della bontà dell'addestramento, detta validation set (in italiano insieme di validazione).

[1]