Predlog za izdelavo
Slovarja sodobnega slovenskega jezika
69
3.6.1
A
NALIZA KONKORDANČNEGA NIZA
Pri pridobivanju in analizi korpusnih podatkov smo želeli postopke čim bolj optimizirati: naš končni cilj je
bil pridobiti leksikalno-gramatične podatke iz korpusa čim bolj avtomatsko, hkrati pa v procesu ne
izgubiti ničesar, kar bi bilo glede na zastavljen namen leksikalne baze in njene uporabnike relevantnega.
Ta cilj je bilo mogoče doseči postopoma, zato je bil prvi korak v opisu leksikalne enote analiza
konkordančnega niza, na podlagi katere smo ugotavljali osnovno obnašanje obravnavane enote v realnih
besedilih. Analiza konkordančnega niza je potekala v več fazah. Najprej smo s pomočjo konkordančnika v
orodju Sketch Engine izdelali naključni ali po določenih kriterijih filtrirani vzorec najmanj 150 in navadno
ne več kot 300 konkordanc, ki smo jih nato s posebnim programom prenesli v Excelovo datoteko, kjer so
bile pripravljene za nadaljnjo obdelavo. Analiza je bila primarno namenjena pomenski členitvi in
registriranju udeleženske zgradbe ter stavčnih vzorcev pri posameznih pomenih, očitne pa so postale
tudi podrobnosti skladenjskega okolja preučevane besede, kar nam je koristilo pri oblikovanju pomenske
sheme, npr. pri določanju tipičnih semantičnih tipov na posameznem udeleženskem mestu, kot
prikazuje Slika 35. Poleg tega smo na ta način prepoznavali slovnično obnašanje leksikalne enote, npr.
prevladujočo tretjeosebno rabo ali množinsko obliko, prevladujočo upovedovalno možnost (npr.
zanikanje), besedilni tip, govorni položaj ter pragmatične in druge slovnično-pomenske lastnosti.
S
LIKA
35:
A
NALIZA KONKORDANČNEGA NIZA ZA GLAGOL
KLONITI
Z VIDIKA DOLOČANJA SEMANTIČNIH TIPOV UDELEŽENCEV IN STAVČNIH
VZORCEV
3.6.2
L
EKS IKALNO
-
GRAMATIČNI PROFIL LEKS IKALNE ENOTE IN ORODJE
S
KETCH
E
NGINE
Orodje Sketch Engine
49
(SkE) smo uporabili kot osnovni pripomoček za pridobivanje in analizo leksikalno-
gramatičnih podatkov iz korpusa in za postopek avtomatizacije, ki ga opišemo v nadaljevanju. Orodje
vsebuje več aplikacij, ki omogočajo analizo posamezne leme v zelo obsežnem lematiziranem in
oblikoslovno označenem korpusu. Poleg označenega korpusa potrebuje orodje za ustrezno delovanje
49
Sketch Engine:
.