Parsimine

Parsimine ehk süntaksianalüüs (ka süntaktiline analüüs; inglise parsing) on protsess, milles arvutikeeles või andmestruktuurides esinevaid sõnesid analüüsitakse vastavalt loomuliku keele formaalse grammatika reeglitele. Ingliskeelne termin parsing tuleneb ladinakeelsest sõnast pars (orationis), mis tähendab osa (kõnest).^[1]

Parsimist tõlgendatakse keeleteaduse ja informaatika harudes üldjuhul erinevalt.

Traditsioonilist lauseparsimist kasutatakse tihti mingi kindla lause või sõna täpse tähenduse mõistmiseks. Sageli rõhutatakse, kui oluline on lause jaotamine lauseliikmeteks.^[2]

Arvutilingvistikas kasutatakse terminit viitamaks arvuti poolt teostatud lauseanalüüsile, mille tulemuseks on lauseosade omavahelisi süntaktilisi suhteid kujutav struktuur.^[3]

Psühholingvistikas kasutatakse terminit, kirjeldades keele mõistmist. Selles kontekstis viitab parsimine viisile, kuidas inimesed analüüsivad mingit lauset või fraasi (kõne- või kirjakeeles) vastavalt grammatikale, määratledes lauseliikmeid, süntaktilisi suhteid jne.^[1]

Informaatikas mõistetakse parsimist kui protsessi, mille tulemuseks on programmikoodi kujutav pars- või süntaksipuu.^[4] See protsess on kolmeastmeline:

leksikaline analüüs – leksikalist analüsaatorit (ka lekser) kasutatakse sõnade ära tundmiseks ja nende märgendamiseks;
süntaktiline analüüs – kontrollib, kas lekserilt saadud märgendid moodustavad mingi mõistliku lause;
semantiline analüüs – protsessi viimane samm, mis võtab arvesse leitud lausete tähendused ja tagamõtted ning tegutseb vastavalt nendele.^[4]

Saadud tulemust kasutatakse nii kompilaatorites kui ka interpretaatorites.^[4]

[1]

[2]

[3]

[4]