Predlog za izdelavo
Slovarja sodobnega slovenskega jezika
64
II.
Na
pomenskem nivoju
so posamezni (pod)pomeni opredeljeni najprej s kratkimi pomenskimi
indikatorji, ki oblikujejo
pomenski meni
besede za lažjo navigacijo po geslu. Drugi del pomenske
informacije predstavlja
pomenska shema
, kjer je zabeležena udeleženska zgradba posameznega
pomena v najbolj tipičnem stavčnem vzorcu. Ta naj bi pokazal, kateri so obvezni udeleženci in okoliščine
– oboji zapisani z velikimi črkami kot semantični tipi zaradi možnosti avtomatskega pridobivanja in
nadaljnjega procesiranja – za konkretni pomen. Pomenska shema je oblikovana kot stavčna razlaga, ki
vsebuje pomenski scenarij (zlasti okoliščine in pragmatiko) konkretnega pomena in predstavlja izhodišče
za oblikovanje slovarske definicije. Posamezni (pod)pomen ima lahko tudi stilno, registrsko, področno ali
kako drugo pojasnilo, ki ga v leksikalni bazi beležimo v elementu <oznaka>, s pripisom ustreznega
atributa, kot npr. področje, kontekst, register, slovnica itd.
III.
Eksplicitno je skladenjskim podatkom namenjen
skladenjski nivo
. Na tem nivoju so za vsak
registrirani (pod)pomen besede v iztočnici beleženi besednozvezni in stavčni vzorci v obliki
formaliziranih zapisov, ki služijo avtomatičnemu luščenju podatkov iz korpusov in organizaciji kolokacij.
IV.
Sledi
kolokacijski nivo
, na katerem so za vsak konkretni (pod)pomen besede registrirani
besednozvezni in stavčni vzorci potrjujeni s tipičnimi leksikalnimi zapolnitvami – kolokacijami.
V.
Vloga
korpusnih zgledov
, ki so navedeni pri posameznih pomenih, stalnih zvezah in frazeoloških
enotah, je ponazoriti in potrditi vse predhodne informacije ter hkrati pokazati obnašanje besede oz.
njenega pomena v njenem najbolj naravnem in tipičnem besedilnem okolju.
Leksikalna baza za slovenščino je ob zaključku projekta SSJ obsegala 2.500 gesel oz. nekaj več kot 10.900
leksikalnih enot, ki vsebujejo pomensko razlago in druge podatke po posameznih nivojih. Jezikovnim
tehnologom in jezikoslovcem, zlasti leksikografom, je na voljo v formatu XML, skupaj z DTD shemo, ki
definira formalno strukturo leksikalne baze in omogoča prilagoditev informacij za različne tipe slovarskih
priročnikov. Informacije, ki so strukturirane v Leksikalni bazi za slovenščino, so poskusno – kot ena od
možnih spletnih vizualizacij – na ogled tudi v testni verziji na spletu.
44
Lastnik leksikalne baze za slovenščino je Ministrstvo za izobraževanje, znanost in šport Republike
Slovenije. Pogodba med Ministrstvom in izvajalci projekta določa, da se za prenos baz podatkov na tretje
osebe in označevanje avtorskih del uporabi licenca »priznanje avtorstva« + »nekomercialno« + »deljenje
pod istimi pogoji«, ki dovoli uporabnikom avtorsko delo in njegove predelave reproducirati, distribuirati,
dajati v najem, priobčiti javnosti in predelovati pod pogojem, da se navede avtorja, da ne gre za
komercialno uporabo in da se izvirna dela ali predelave naprej širijo pod istimi pogoji.
3.5
S
HEMA
DTD
Za potrebe leksikalne baze je bila izdelana DTD shema, ki je prilagojena delu v slovarskih urejevalnikih,
kot so naprimer DPS (Dictionary Writing System) francoskega podjetja IDM,45 iLex danskega podjetja
EMP,46 TLex podjetja TshwaneDJe iz Južne Afrike,47 Lingvo.Pro ruskega podjetja ABBYY48 in podobnih.
44
Dostopno na:
.
45
DPS Dictionary Writing System
46
iLex
47
TLex