Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike

Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik)...

Full description

Saved in:
Bibliographic Details
Main Authors: Špela Arhar Holdt, Jaka Čibej
Format: Article
Language:English
Published: University of Ljubljana Press (Založba Univerze v Ljubljani) 2018-12-01
Series:Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Subjects:
Online Access:https://journals.uni-lj.si/slovenscina2/article/view/8213
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849701411712925696
author Špela Arhar Holdt
Jaka Čibej
author_facet Špela Arhar Holdt
Jaka Čibej
author_sort Špela Arhar Holdt
collection DOAJ
description Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si.
format Article
id doaj-art-d02c6316dc804fc6af8965389bb05e85
institution DOAJ
issn 2335-2736
language English
publishDate 2018-12-01
publisher University of Ljubljana Press (Založba Univerze v Ljubljani)
record_format Article
series Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
spelling doaj-art-d02c6316dc804fc6af8965389bb05e852025-08-20T03:17:57ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362018-12-016210.4312/slo2.0.2018.2.33-66Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnikeŠpela Arhar HoldtJaka Čibej Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si. https://journals.uni-lj.si/slovenscina2/article/view/8213Sloleksleksikon besednih oblikoblikoslovni vzorcisamostalnikslovenščina
spellingShingle Špela Arhar Holdt
Jaka Čibej
Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Sloleks
leksikon besednih oblik
oblikoslovni vzorci
samostalnik
slovenščina
title Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
title_full Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
title_fullStr Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
title_full_unstemmed Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
title_short Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
title_sort oblikoslovni vzorci v leksikonu sloleks izhodiscni nabor za samostalnike
topic Sloleks
leksikon besednih oblik
oblikoslovni vzorci
samostalnik
slovenščina
url https://journals.uni-lj.si/slovenscina2/article/view/8213
work_keys_str_mv AT spelaarharholdt oblikoslovnivzorcivleksikonusloleksizhodiscninaborzasamostalnike
AT jakacibej oblikoslovnivzorcivleksikonusloleksizhodiscninaborzasamostalnike