Predlog za izdelavo
Slovarja sodobnega slovenskega jezika
113
K
AZALNIK
K1
št.
Ime kazalnika
trajanje Začetek (mes.)
Konec (mes.)
K1
Postavitev računalniške infrastrukture
6
1
6
V prvih šestih mesecih je treba postaviti celotno računalniško infrastrukturo za uspešno delovanje
leksikografske ekipe in vseh ostalih strokovnih sodelavcev. Med osnovno infrastrukturo spada predvsem:
ureditev pogojev za delo s programom za sestavljanje slovarjev
iLex
o
postavitev strežnika in ureditev licenc
o
izdelava sheme XML in vizualizacije
o
vključitev iLexa v predvideno kroženje podatkov (uvoz, izvoz, objava)
ureditev vseh pogojev za delo s programom za poizvedovanje po korpusih
Sketch Engine
o
postavitev lastne inštalacije in ureditev licenc za leksikografe
o
izbira slovnice besednih skic za avtomatski izvoz podatkov
o
vzpostavitev programskega vmesnika za avtomatski izvoz podatkov
vzpostavitev
portala SSSJ
z vizualizacijo avtomatsko izvoženih podatkov iz korpusa in vsemi
predvidenimi deli (zavihki)
vzpostavitev
spletnega servisa
za izkoriščanje moči množic z avtomatiziranim uvozom podatkov
iz orodja Sketch Engine v spletni servis in izvozom iz servisa v iLex
vzpostavitev sprotnega objavljanja podatkov, urejenih v programu iLex, na portalu SSSJ
vzpostavitev diskusijske platforme za strokovne sodelavce, predvsem
o
terminološka platforma
o
normativna platforma
intranet
Kazalnik je delujoča infrastruktura z vsemi naštetimi elementi – dokazuje se s (krajšo) specifikacijo.
K
AZALNIK
K2
št.
Ime kazalnika
trajanje Začetek (mes.)
Konec (mes.)
K2
Avtomatsko luščenje podatkov iz korpusa 6
1
6
Iz korpusa Gigafida se s pomočjo programskega vmesnika za izvoz kolokacij in dobrih zgledov v
programu Sketch Engine na podlagi struktur iz slovnice besednih skic (
sketch grammar
) izvozi podatke za
100.000 glagolskih, pridevniških in prislovnih lem ter lem občnih samostalnikov, v razmerju 50 (občni
samostalniki), 25 (pridevniki), 15 (glagoli) in 10 (prislovi). Ostale besedne vrste niso vključene v
prikazovanje avtomatsko generiranih podatkov.
Kazalnik so izvoženi podatki v formatu XML in prikazani na portalu v fazi 1.