Tehisnärvivõrk

Tehisnärvivõrgu struktuur koosneb tavaliselt omavahel ühendatud kihtidest. Kõige tähtsamad kihid närvivõrgus on sisendkiht, varjatud kiht ja väljundkiht. Iga kiht sisaldab sõlmesid oma sisendite ja väljunditega, millel on aktivatsioonifunktsioonid. Kihtides olevate sõlmede ja varjatud kihtide arv sõltuvad närvivõrgu lahendatavast probleemist^[3]. Klassikalisel närvivõrgul on lisaks sisend-, väljund- ja varjatud sõlmedele ka vabaliikme sõlmed, mis jooksevad väljund- ja peidetud kihtidesse^[1]^[2]^[4]. Üksikute sõlmede vahelistel ühendustel on kaalud ja need määravad, kui suur osa ühe sõlme väljundist jõuab teise sõlme sisendisse.

Sisendkiht

Sisendkiht koosneb ühest või enamast sisendsõlmest. Sisendkihi sõlmed väljastavad normaliseeritud arvväärtused järgnevatele kihtidele. Väljundi normaliseerimiseks rakendatakse tavaliselt sama aktivatsioonifunktsiooni kui varjatud kihtidel.

Varjatud kihid

Varjatud kiht võib sisaldada üht või enamat varjatud sõlme, mis võtavad sisse endast kõrgemal asuvate sõlmede ja vabaliikme sõlmede väljundi korrutatuna läbi ühenduse kaaluga. Sõltuvalt närvivõrgust võib varjatud kiht närvivõrgust puududa. Klassikaliselt ühe varjatud kihi sõlme väljund leitakse valemiga

$\sigma \left(\sum _{j=1}^{N}V_{ij}x_{j}+T_{i}^{hid}\right),$

kus σ() kutsutakse aktivatsioonifunktsiooniks, N on sisendsõlmede arv, V_ij on kaalud, x_j on sisendid sisendsõlmedele ja T_i^hid on vabaliige, mis määrab varjatud sõlme lävendi ^[5]. Aktivatsioonifunktsiooni eesmärk on piirata sõlme väljundit ette määratud vahemikku, et selle väljund ei üleküllastaks järgnevaid sõlmi. Tihti rakendatakse käivitusfunktsioonina kas lineaarseid, sigmoid või Gaussi jaotusel põhinevaid funktsioone^[6]. Kaalud määravad, kui suur mõju on igal sisendil sõlme lõppväljundi arvutamisel. Närvivõrgu treenimise käigus muudetakse ainult kaalude väärtuseid.

Väljundkiht

Väljundkiht koosneb ühest või enamast väljundsõlmest, mille tulem ei pea olema normaliseeritud. Väljundkihis olevate sõlmede tulemid loetakse närvivõrgu vastusteks. Sõltuvalt rakendusest võib üks väljundsõlm määrata kuuluvusklassi või on selle asemel mitu sõlme, mis kõik määravad oma klassi kuuluvuse tõenäosust.^[2]

Vabaliikmed

Vabaliikmeid kutsutakse ka negatiivseks lävendiks^[1]. Vabaliikmed saadavad oma väärtuse peidetud sõlmede ja väljundsõlmede sisenditesse konstantidena. Vabaliikmed hoiavad endas numbrilist väärtust (vaikimisi 1), mis ei muutu õppimisprotsessi käigus, aga selle kaal võib muutuda. Vabaliikmed suurendavad närvivõrgu võimekust, kuna nad toovad sisse konstandid, mis ei sõltu sisendist.^[2]

Tehisnärvivõrkude üks erilisemaid omadusi võrreldes teiste arvutuslike arhitektuuridega on selle õppimisvõime. Kui närvivõrgule on määratud kindel ülesanne, funktsioonide hulk, mida ta rakendab ja vaatluste hulk oodatud tulemustest, siis suudab närvivõrk leida kaalud, mille puhul on võimalik teha ennustusi mingi veaga.

Juhendamata õpe

Juhendamata õppe käigus ei anta tehisnärvivõrgule tahetud lõppvastuseid treeningu ajal, selle asemel moodustuvad süsteemid, mis kategoriseerivad peamisi mustreid sisendandmetes. Juhendamiseta õppimismeetodit rakendatakse tihti andmete klasterdamiseks, servade eristamiseks, sarnasuste tuvastamiseks ja olukordades, kus ei ole ette määratud, mis omaduste järgi andmed peaksid jagatud olema.^[7]

Juhendatud õpe

Juhendatud õppe käigus on olemas sisendandmete kõrval ka väljundandmed ning lisaks kontrollmaterjalid sarnases formaadis. Tehisnärvivõrk töötleb sisendit ja toodab oma pakutud väljundi, mida võrreldakse soovitud väljundiga. Iga võrdluse käigus leitud viga saadetakse närvivõrgule tagasi ja toimub kaalude uuendamine. Juhendamisega õpet kasutatakse enamasti mustrite tuvastamiseks ja regressioonis, kus klassikaliste meetodite rakendamine on liiga kulukas või keeruline.^[8]^[9] Kolm kõige tuntumat meetodit, mida rakendatakse juhendamisega õppel, on tagasilevi, simuleeritud lõõmutamine ja geneetilised algoritmid.

Vea arvutus

Närvivõrgu genereeritud väljundit võrreldakse soovutatakse väljundiga ja arvutatakse viga valemiga

$E=\sum _{P}\sum _{p}(y_{i}-t_{i})^{2},$

kus t_i on soovitud väljundi väärtus, y_i on närvivõrgu genereeritud väljund, p on väljundsõlmede arv ja P on treeningpunktide arv. Iga iteratsiooniga liigub viga närvivõrgus tagurpidi tagasi ja selle abil muudetakse kaalude väärtuseid^[3].

Tagasilevi

Tagasilevi algoritmi rakendatakse pärilevivõrkude treeningul^[3]. Tagasilevi algoritm kasutab igal iteratsioonil leitud viga ja liigub närvivõrgus tagurpidi üles. Iga sõlme läbimisel leitakse kaalude muudatused ning kihtide kaupa leitakse ka uued vead järgnevate sõlmede kaalude muudatuste jaoks. Seda korratakse kuni närvivõrk on tagurpidi läbitud ja kaalud muudetud. Iga sõlme raskuse muudatus leitakse, kui

$\Delta _{w_{ij_{m}}}=\epsilon \delta _{j_{p}}\alpha _{i_{q}}{\begin{cases}\delta _{j_{p}}=\alpha _{j_{q}}(1-\alpha _{j_{q}})(t_{j_{q}}-\alpha _{j_{q}}){\text{ kui on väljundneuron}}\\\delta _{j_{p}}=\alpha _{j_{q}}(1-\alpha _{j_{q}})\sum _{x=0}^{n}\delta _{k_{x}}w_{jk_{x}}{\text{ kui on peidetud neuron}}\end{cases}},$

kus i on eelnev sõlm, j on järgnev sõlm, k on kihtide arv, mis järgnevad sõlmele j; ij on kaal sõlmede i ja j vahel, jk on kaal sõlmede j ja k vahel, w on kaalud, α on sõlmede aktivatsioonid ja ε on õpisamm.^[2] Kuna tagasilevi parandab kaalusid lähtudes gradiendist, siis see on väga tundlik lokaalsete miinimumide suhtes ja ei lähene alati globaalsele miinimumile^[10].

Simuleeritud lõõmutamine

Simuleeritud lõõmutamine on analoogne lõõmutamisele, mis on füüsikaline protsess, kus teras kuumutatakse üle kriitilise punkti ja siis aeglaselt jahutamise käigus moodustub kristalne struktuur. Simuleeritud lõõmutamise käigus algoritm alustab tegevust kõrgel temperatuuril (T) ja iga iteratsiooniga T langeb ette määratud miinimumini. Iga T juures määratakse uued suvalised kaalud ja parimad tulemused jäetakse alles.^[10] Alternatiivina seotakse T juhusliku sammu pikkusega ja algoritm astub järjest väiksema sammuga juhuslikus suunas. Lokaalsete miinimumide vältimiseks valib simuleeritud lõõmutamise algoritm ette määratud tõenäosusega ka halvemaid juhtumeid, kuid seni läbitud juhtumite seast parimad jäetakse ikkagi alles.^[11] Simuleeritud lõõmutamise suur eelis teiste otsingumeetodite ees on selle suur juhuslik otsinguruum, mille tõttu jääb see palju harvem lokaalsete miinimumide taha kinni^[10].

Geneetiline algoritm

Geneetiline algoritm on globaalne otsingumeetod, mis otsib seoseid ühest punktide populatsioonist teiseni. Kuna see algoritm valib pidevalt parameetrite ruumist uusi punkte, siis selle otsing on alati suunatud parimatele tulemustele. Kõigepealt luuakse punktidest algne populatsioon ja arvutatakse iga punkti jaoks tema viga. Sõltuvalt vigadest luuakse uus populatsioon, kus vanast populatsioonist parimatel punktidel on suurem tõenäosus sattuda uude populatsiooni. Uue populatsiooni punktid paaritakse suvaliselt ja iga punkti puhul leitakse nende kombineeritud järglased koos mutatsioonidega. See tulem täidab uue populatsiooni ning tsüklit korratakse, kuni jõutakse optimaalseima lahenduseni või määratud iteratsioonide arv saab täis. Korduvalt on väidetud, et geneetiline algoritm on tõhusam kui muud traditsioonilised otsingumeetodid, kuna see ei jää lokaalsete miinimumide taha kinni nagu tagurpidi levik ja on rohkem suunatud kui simuleeritud lõõmutamine.^[11]

Stiimulõpe

Stiimulõpe eeldab, et agendid toimivad keskkonnas, tunnetavad oma olukorda, keskkonna olukorda ja valivad oma tegevused vastavalt vastastikusele mõjule. Tähtis element stiimulõppes on agentide eesmärk, mis tavaliselt on tasu signaali maksimeerimine. Keskkonnas otsuste tegemine mõjutab tasu signaali ja seega ka eesmärki. Stiimulõppes jagatakse probleem metoodikaks, tasufunktsiooniks, väärtusfunktsiooniks ja keskkonnamudeliks.^[12]

Närvivõrgu mudel