Parsimine
From Wikipedia, the free encyclopedia
Parsimine ehk süntaksianalüüs (ka süntaktiline analüüs; inglise parsing) on protsess, milles arvutikeeles või andmestruktuurides esinevaid sõnesid analüüsitakse vastavalt loomuliku keele formaalse grammatika reeglitele. Ingliskeelne termin parsing tuleneb ladinakeelsest sõnast pars (orationis), mis tähendab osa (kõnest).[1]
Parsimist tõlgendatakse keeleteaduse ja informaatika harudes üldjuhul erinevalt.
Traditsioonilist lauseparsimist kasutatakse tihti mingi kindla lause või sõna täpse tähenduse mõistmiseks. Sageli rõhutatakse, kui oluline on lause jaotamine lauseliikmeteks.[2]
Arvutilingvistikas kasutatakse terminit viitamaks arvuti poolt teostatud lauseanalüüsile, mille tulemuseks on lauseosade omavahelisi süntaktilisi suhteid kujutav struktuur.[3]
Psühholingvistikas kasutatakse terminit, kirjeldades keele mõistmist. Selles kontekstis viitab parsimine viisile, kuidas inimesed analüüsivad mingit lauset või fraasi (kõne- või kirjakeeles) vastavalt grammatikale, määratledes lauseliikmeid, süntaktilisi suhteid jne.[1]
Informaatikas mõistetakse parsimist kui protsessi, mille tulemuseks on programmikoodi kujutav pars- või süntaksipuu.[4] See protsess on kolmeastmeline:
- leksikaline analüüs – leksikalist analüsaatorit (ka lekser) kasutatakse sõnade ära tundmiseks ja nende märgendamiseks;
- süntaktiline analüüs – kontrollib, kas lekserilt saadud märgendid moodustavad mingi mõistliku lause;
- semantiline analüüs – protsessi viimane samm, mis võtab arvesse leitud lausete tähendused ja tagamõtted ning tegutseb vastavalt nendele.[4]
Saadud tulemust kasutatakse nii kompilaatorites kui ka interpretaatorites.[4]