Predlog za izdelavo
Slovarja sodobnega slovenskega jezika
63
pomeni, da so vsi podatki, ki jih predvidevajo posamezni nivoji, razvrščeni pod vse registrirane pomene
obravnavane besede.
S
LIKA
34: O
RGANIZACIJA LEKSIKALNO
-
GRAMATIČNIH PODATKOV V
L
EKSIKALNI BAZI ZA SLOVENŠČINO
I.
Hierarhično najvišja je
lema
, tj.
iztočnica v osnovni obliki
, ki zastopa vse
pomene
in
podpomene
,
stalne besedne zveze
in
frazeološke enote
, v katerih se obravnavana iztočnica pojavlja kot sestavni
element. Na iztočnico so v bazi pripeti še: podatek o besedni vrsti in podatek o frekvenci v korpusu.
Besednovrstna opredelitev je zaradi možnosti nadaljnjega procesiranja podatkov skladna s postopki
lematizacije in oblikoslovnimi oznakami, uporabljenimi pri oblikoskladenjskem označevanju korpusa
Gigafida.
Na istem nivoju kot iztočnica se v leksikalni bazi nahajajo
frazeološke enote
, kar pomeni, da jih ne
podrejamo posameznim (pod)pomenom, ampak so z iztočnico povezane zgolj oblikovno. Bistvena
elementa frazeološkega razdelka sta frazeološka enota v osnovni obliki ali več pojavnih oblikah,
pomenski indikator in/ali definicija ter korpusni zgledi.
Stalne besedne zveze
so v leksikalni bazi obravnavane kot samostojne leksikalne enote, in sicer na ravni
gesla v primeru, da so od pomenov besede v iztočnici neodvisne, in na ravni posameznih pomenov, če
obstaja med besedno zvezo in pomenom besede v iztočnici razvidna pomenska povezava. Tako kot
besede imajo tudi stalne zveze razlago pomena in/ali kratki pomenski indikator, navedeno področje
rabe, zlasti v primeru, ko pripadajo določenemu terminološkemu področju, tipično besedilno okolje v
obliki kolokacij, če se to izkazuje v realnih besedilih, in korpusne zglede.