From Wikipedia, the free encyclopedia
Dins l'aprenentatge automàtic i la mineria de dades, l'aprenentatge supervisat[1] és una tècnica per deduir una funció a partir de dades d'entrenament. Les dades d'entrenament consisteixen en parells d'objectes, sovint vectors, on una component són les dades d'entrada i l'altre correspon als resultats desitjats. La sortida de la funció pot ésser un valor numèric, en el cas de problemes de regressió, o bé una etiqueta de classe, com en els problemes de classificació. L'objectiu de l'aprenentatge supervisat és crear una funció capaç de preveure el valor corresponent a qualsevol objecte d'entrada vàlid després d'haver vist una sèrie d'exemples, les dades d'entrenament. Per això, s'ha de generalitzar a partir de les dades presentades a situacions no vistes anteriorment.
L'algorisme genera una funció que relaciona cada entrada amb la sortida desitjada. En el cas de problemes de classificació tenim que el sistema ha d'aprendre una funció (aproximar la conducta de la funció) a partir d'uns exemples que s'expressen en termes de l'aplicació d'un vector a un conjunt de classes. És a dir, es proporciona un conjunt de dades al sistema que han estat etiquetats de forma manual amb els valors esperats. Les xarxes neuronals (supervisades) i els arbres de decisió són exemples d'algorismes d'aprenentatge supervisat. La base de coneixement del sistema està format per exemples d'etiquetatges anteriors.
Per tal de resoldre un problema d'aprenentatge supervisat, com ara reconeixedors d'imatges, de veu o de qualsevol altre tipus, s'han de considerar diversos passos:
Un terme de l'aprenentatge supervisat són els classificadors. Existeix una àmplia gamma de classificadors, cadascun amb els seus avantatges i inconvenients. Els més utilitzats són les xarxes neuronals, l'algoritme dels k veïns més propers, el classificador de Bayes i els arbres de decisió.
A l'hora d'escollir les dades d'entrenament i l'algoritme d'aprenentatge s'han de considerar, a part dels passos anteriors, alguns factors com ara:
Donat un conjunt de punts de la forma (x, g(x)), l'aprenentatge supervisat ha de generar una funció g. Suposem que el conjunt de punts per què el comportament de g és conegut és una mostra de variables aleatòries independents distribuïdes d'acord amb una distribució de probabilitat desconeguda p. Es considera també una funció de pèrdua L:
d'on Y és la codominància de g, i L és una funció mapes en el número no negatiu. Es poden assignar diferents restriccions a L. La quantitat L(z,y) és la pèrdua soferta en la predicció de z, com el valor de g quan el seu valor vertader és y'.
El risc associat a una funció f és l'esperança matemàtica de la funció de pèrdua:
Si la distribució de probabilitat p és discreta es pot reescriure la fórmula anterior utilitzant una integral en comptes d'un sumatori.
Ara l'objectiu és trobar una funció f* on el risc R(f* ) sigui mínima.
Tot i això, donat el comportament dels g generalment només és conegut per un conjunt finit de punts (x1, y1), ..., (xnyn), només es pot aproximar el risc vertader, per exemple amb el risc empíric:
Selecció de la funció f* que minimitza el risc empíric es coneix com el principi de minimizació empírica de riscos. Teoría estadística d'aprenentatge investiga sota quines condicions la minimització del risc empíric és admissible i la bondat que són les aproximacions que s'esperen.
A l'hora d'avaluar un classificador, s'utilitzaran unes dades de prova, que hauran de ser del mateix tipus i característiques que les utilitzades en la fase d'entrenament, que s'introduiran al programa dissenyat. A partir d'aquí, el detector generarà uns resultats a aquestes dades que haurem de comparar amb les anotacions manuals creades prèviament.
Per tal de comparar els resultats, es poden crear matrius de confusió, que relacionen els valors anotats per l'usuari (manual) amb aquells anotats pel classificador (automàtic). Així, aquells resultats que estiguin situats dins les caselles verdes correspondran a les deteccions correctes (la anotació manual i l'automàtica es corresponen) mentre que les que es trobin dins els quadres vermells seran erronis (l'anotació manual i l'automàtica no coincideixen).
En classificadors binaris, com per exemple detectors d'imatges de dia o nit, la matriu de confusió corresponent als resultats de la seva avaluació seria d'aquesta forma:
On:
A partir d'aquests resultats es pot calcular la precisió (P) i el record(R).
Hi ha diverses maneres en què la norma del problema d'aprenentatge supervisat es pot generalitzar:
Seamless Wikipedia browsing. On steroids.