Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike
Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik)...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
University of Ljubljana Press (Založba Univerze v Ljubljani)
2018-12-01
|
| Series: | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
| Subjects: | |
| Online Access: | https://journals.uni-lj.si/slovenscina2/article/view/8213 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849701411712925696 |
|---|---|
| author | Špela Arhar Holdt Jaka Čibej |
| author_facet | Špela Arhar Holdt Jaka Čibej |
| author_sort | Špela Arhar Holdt |
| collection | DOAJ |
| description |
Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si.
|
| format | Article |
| id | doaj-art-d02c6316dc804fc6af8965389bb05e85 |
| institution | DOAJ |
| issn | 2335-2736 |
| language | English |
| publishDate | 2018-12-01 |
| publisher | University of Ljubljana Press (Založba Univerze v Ljubljani) |
| record_format | Article |
| series | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
| spelling | doaj-art-d02c6316dc804fc6af8965389bb05e852025-08-20T03:17:57ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362018-12-016210.4312/slo2.0.2018.2.33-66Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnikeŠpela Arhar HoldtJaka Čibej Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si. https://journals.uni-lj.si/slovenscina2/article/view/8213Sloleksleksikon besednih oblikoblikoslovni vzorcisamostalnikslovenščina |
| spellingShingle | Špela Arhar Holdt Jaka Čibej Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave Sloleks leksikon besednih oblik oblikoslovni vzorci samostalnik slovenščina |
| title | Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike |
| title_full | Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike |
| title_fullStr | Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike |
| title_full_unstemmed | Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike |
| title_short | Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike |
| title_sort | oblikoslovni vzorci v leksikonu sloleks izhodiscni nabor za samostalnike |
| topic | Sloleks leksikon besednih oblik oblikoslovni vzorci samostalnik slovenščina |
| url | https://journals.uni-lj.si/slovenscina2/article/view/8213 |
| work_keys_str_mv | AT spelaarharholdt oblikoslovnivzorcivleksikonusloleksizhodiscninaborzasamostalnike AT jakacibej oblikoslovnivzorcivleksikonusloleksizhodiscninaborzasamostalnike |