Remove ads
From Wikipedia, the free encyclopedia
Tugivektor-masinaid (TVM) [1] kasutatakse juhendatud masinõppes klassifikatsiooni ja regressiooni analüüsiks. Tugivektor vajab treenimiseks eelnevalt märgendatud treenimishulka ning treenitud mudel teeb oma ennustuse märgendamata andmetele olenevalt sellele, kummale poole treenitud hüpertasandit vektor jääb, kusjuures eraldava hüpertasandi kaugus lähimatest treeningandmetest võiks olla võrdne. Eristatakse kõva ja pehme äärega TVM-e: esimesel juhul eeldatakse, et treeningandmeid on võimalik lineaarselt hüpertasandiga eraldada, ja teisel juhul saab TVM-i treenida ka kattuvuse korral.
Tugivektor-masinad leiutasid Vladimir N. Vapnik ja Alexey Chervonenkis 1963. [1]
Tugivektor-masinaid on modifitseeritud, et need tegeleksid ka märgendamata andmete klasteranalüüsiga [2] ja tõenäosusjaotuste väljastamisega (Platti skaleerimine[3]). Samuti kasutatakse kernelitrikki olukorras, kus treeningandmeid ei ole võimalik lineaarselt eraldada, kuid leidub funktsioon treeningandmeid eraldava hüpertasandi kirjeldamiseks.
Antud on treeningandmed, mis koosnevad treeningolemi ja sellele vastava märgendi paaridest
kus vastavalt selle märgendile. Iga on reaalarvuline -dimensionaalne vektor. TVM treenimise ülesanne on leida maksimaalse eraldatusega hüpertasand, mis eraldab punkte punktidest . Maksimaalse eraldatusega tähendab siin kohal, et hüpertasand on lähimatest vastandmärgenditega treeningolemitest võrdsel ja maksimaalsel kaugusel.
Eraldav hüpertasand koosneb punktidest , mis rahuldavad võrrandit
kus on hüpertasandi normaalvektor.
Kui treeningandmed on lineaarselt eraldatavad, me võime valida kaks hüpertasandit, mis mõlemad eraldavad binaarse märgendusega andmed ning on sealjuures suurima võimaliku omavahelise kaugusega. Neid kaht hüpertasandit kirjeldavad kaks võrrandit:
Et kahe hüpertasandi kaugus peab olema maksimaalne ning seda kaugust kirjeldav võrrand on [4], siis me peame minimeerima .
Eelmised kaks võrratust võib ümber kirjutada kujule:
kus optimeerimisülesandeks jääb minimeerimine eelnevast võrrandist sõltuvalt.
Siinkohal vajab märkimist, et tulemus sõltub vaid lähimatest punktidest, mida kutsutaksegi tugivektoriteks.
Et saaksime kasutada TVM-e juhul, kus treeningandmed ei ole lineaarselt eraldatavad ülekattuvuse tõttu, tutvustame hinge kaotusfunktsiooni
Kaotusfunktsiooni väärtus on 0 juhtudel, kus õpitakse ennustama õige märgendiga olemit. Kui aga olem on valel pool hüpertasandit, siis funktsiooni väärtus on proportsionaalne kaugusega sellest tasandist.
Me soovime minimeerida
kus parameeter määrab ära, kui palju soovitakse karistada vale märgendi ennustamist ning kui tähtis on minimaalne . Juhul kus on väike, muutub minimeeritava funktsiooni teine liige tühiselt väikseks ning algoritm käitub nagu kõva äärega TVM.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.