Parsimine ehk süntaksianalüüs (ka süntaktiline analüüs; inglise parsing) on protsess, milles arvutikeeles või andmestruktuurides esinevaid sõnesid analüüsitakse vastavalt loomuliku keele formaalse grammatika reeglitele. Ingliskeelne termin parsing tuleneb ladinakeelsest sõnast pars (orationis), mis tähendab osa (kõnest).[1]

Parsimist tõlgendatakse keeleteaduse ja informaatika harudes üldjuhul erinevalt.

Traditsioonilist lauseparsimist kasutatakse tihti mingi kindla lause või sõna täpse tähenduse mõistmiseks. Sageli rõhutatakse, kui oluline on lause jaotamine lauseliikmeteks.[2]

Arvutilingvistikas kasutatakse terminit viitamaks arvuti poolt teostatud lauseanalüüsile, mille tulemuseks on lauseosade omavahelisi süntaktilisi suhteid kujutav struktuur.[3]

Psühholingvistikas kasutatakse terminit, kirjeldades keele mõistmist. Selles kontekstis viitab parsimine viisile, kuidas inimesed analüüsivad mingit lauset või fraasi (kõne- või kirjakeeles) vastavalt grammatikale, määratledes lauseliikmeid, süntaktilisi suhteid jne.[1]

Informaatikas mõistetakse parsimist kui protsessi, mille tulemuseks on programmikoodi kujutav pars- või süntaksipuu.[4] See protsess on kolmeastmeline:

  1. leksikaline analüüs – leksikalist analüsaatorit (ka lekser) kasutatakse sõnade ära tundmiseks ja nende märgendamiseks;
  2. süntaktiline analüüs – kontrollib, kas lekserilt saadud märgendid moodustavad mingi mõistliku lause;
  3. semantiline analüüs – protsessi viimane samm, mis võtab arvesse leitud lausete tähendused ja tagamõtted ning tegutseb vastavalt nendele.[4]

Saadud tulemust kasutatakse nii kompilaatorites kui ka interpretaatorites.[4]

Loomulikud keeled

muuda

Traditsioonilised meetodid

muuda

Parsimine kui traditsiooniline grammatikaharjutus hõlmab teksti jaotamist lauseliikmeteks, selgitades iga liikme vormi, funktsiooni ja sünktaktilist suhet teiste liikmetega. Saadud selgitused tulenevad suuresti keele käänetest ja pööretest, mis võivad olla võrdlemisi keerukad, eriti tugevalt hääldatud keelte puhul.[2] Selle jaoks, et parsida fraas mees hammustab koera, peab märkima kolme asja:

  1. mees – nimetavas käändes olev nimisõna, mis on lause alus;
  2. hammustab – ainsuse 3. pöördes olev lause öeldis, sõnast 'hammustama';
  3. koera – osastavas käändes olev nimisõna, mis on lause sihitis.[2]

Lauseosadevaheliste suhete kujutamiseks kasutatakse mõnikord lausediagramme.[5]

Psühholingvistika

muuda

Psühholingvistika kontekstis ei hõlma parsimine ainult lauses olevate sõnade liigitamist ja nendevaheliste seoste äratundmist, vaid ka lause tähenduse hindamist vastavalt süntaksi reeglitele, mis tulenevad igast järgnevast sõnast lauses. Tavaliselt parsivad lugejad lauseid osade kaupa ning üritavad pärast iga osa tõlgendada lause tähendust. Saades piisavalt informatsiooni, teevad lugejad oletuse lause järgneva sisu ja kogu tähenduse kohta. Kohates uut lauseosa, üritavad lugejad siduda seda nii varasema tõlgenduse kui ka tehtud järeldustega. Aia-tee lause efekt esineb olukorras, kus lugeja on ebamäärase sõnastuse tõttu tõlgendanud lugemise ajal lause tähendust valesti. Õige tähendus tuleb välja lause lõppu jõudes. Seega peab lugeja lauset uuesti lugema ja hindama, et selle tähendusest aru saada.[6]

Viited

muuda
  1. 1,0 1,1 "Parse" (inglise keeles). dictionary.reference.com. Vaadatud 4. november 2018.{{netiviide}}: CS1 hooldus: tundmatu keel (link)
  2. 2,0 2,1 2,2 "Grammar and Composition" (inglise keeles). Originaali arhiivikoopia seisuga 1. detsember 2016. Vaadatud 4. november 2018.{{netiviide}}: CS1 hooldus: tundmatu keel (link)
  3. Ariva, Lilian. Eskor, Liina. "Mis on arvutilingvistika?" (PDF). Vaadatud 27. november 2018.{{netiviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  4. 4,0 4,1 4,2 "What is a parser?" (inglise keeles). Vaadatud 27. november 2018.{{netiviide}}: CS1 hooldus: tundmatu keel (link)
  5. "Diagramming Sentences" (inglise keeles). Originaali arhiivikoopia seisuga 9. oktoober 2008. Vaadatud 27. november 2018.{{netiviide}}: CS1 hooldus: tundmatu keel (link)
  6. Reisberg, D. (2010). Cognition: Exploring the science of the mind. (4 ed.). New York, NY: W.W. Norton & Company, Inc.
  NODES
dada 1
dada 1
Done 1
see 2