Predlog za izdelavo
Slovarja sodobnega slovenskega jezika
11
Wikivir
, spletna digitalna knjižnica; [licenca CC BY-SA / GFDL]
Wikipedija
, prosta večjezična enciklopedija, ki jo soustvarjajo sodelavci z vsega sveta; [licenca CC
BY-SA / GFDL]
Slovar slovenskega znakovnega jezika,
13
ki vsebuje slovenske besede, opis kretenj, s katerimi se
izvaja in videoposnetek. [FRI, Uni-Lj in Zveza društev gluhih in naglušnih Slovenije]
III.
E
LEKTRONSKE ZBIRKE BESEDIL
(
KORPUSI
)
Korpus
Gigafida
, izdelan pri projektu SSJ,
14
vsebuje 1,2 milijarde slovenskih besed, zbranih na
podlagi slovenskih besedil (časopisi, revije, internet, stvarna besedila, leposlovje in drugo) med
leti 1990 in 2011; [licenca CC BY-NC-SA za korpus ccGigafida, sicer pogodba o nekormercialni
uporabi]
Korpus
Kres
,
15
100-milijonski uravnoteženi podkorpus korpusa Gigafida, vsebuje po 20 %
časopisnih, revijalnih in internetnih besedil, 18 % stvarnih besedil, 17 % leposlovja in 5 %
drugih besedil; [licenca CC BY-NC-SA za korpus ccKres, sicer pogodba o nekormercialni uporabi]
Korpus
Gos
,
16
referenčni korpus slovenskega govorjenega jezika, izdelan v projektu SSJ, vsebuje
milijon besed, transkribiranih na glasoslovni, leksemski, oblikoslovni in skladenjski ravni; [licenca
CC BY-NC-SA za transkripcije]
druge prosto dostopne
elektronske besedilne zbirke
, npr.
korpus Šolar, besedila, ki so jih učenci slovenskih osnovnih in srednjih šol samostojno tvorili
pri pouku
17
korpus slovenskih spletnih besedil slWaC
KoRP – korpus besedil odnosov z javnostmi
korpus slovenskih besedil s področja informatike in nekaterih drugih terminoloških področij
korpusi besedil iz družabnih omrežij (npr. korpus slovenskih tvitov) itd.
18
IV.
J
EZIKOVNOTEHNOLOŠKA ORODJA
Orodje
Sketch Engine,
prilagojeno za slovenščino
,
s pomočjo katerega je mogoče pridobivati
relevantne leksikalne, slovnične in pomenske podatke iz korpusa z uporabo aplikacij, kot so:
o
konkordančnik za analizo in urejanje konkordančnega niza za določeno besedo, besedno
obliko, zvezo ipd.
o
Besedne skice – avtomatsko profiliranje leksikalnega obnašanja besed in besednih zvez
na podlagi oblikoskladenjsko označenega korpusa
o
Primerjalne skice – avtomatska primerjava besedilnega okolja za različne besede,
besedilne žanre ipd.
12
Dostopno na:
.
13
Dostopno na:
in
.
14
Korpus Gigafida:
.
15
Korpus Kres: <
/
>
.
16
Korpus Gos:
.
17
Korpus Šolar:
.
18
Zadnjih pet in drugi korpusi so dostopni na:
ali
.