Luščenje definicijskih kandidatov iz specializiranih korpusov
Predstavljamo metodo za luščenje definicij iz specializiranih korpusov. Metoda je bila razvita za slovenščino in angleščino, sestavljajo pa jo trije pristopi: v prvem definicije luščimo z leksikoskladenjskimi vzorci, drugi uporablja avtomatsko izluščeno terminologijo, tretji pa lušči sta...
Saved in:
| Main Author: | |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
University of Ljubljana Press (Založba Univerze v Ljubljani)
2014-12-01
|
| Series: | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
| Subjects: | |
| Online Access: | https://journals.uni-lj.si/slovenscina2/article/view/6932 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849721421515718656 |
|---|---|
| author | Senja Pollak |
| author_facet | Senja Pollak |
| author_sort | Senja Pollak |
| collection | DOAJ |
| description | Predstavljamo metodo za luščenje definicij iz specializiranih korpusov. Metoda je bila razvita za slovenščino in angleščino, sestavljajo pa jo trije pristopi: v prvem definicije luščimo z leksikoskladenjskimi vzorci, drugi uporablja avtomatsko izluščeno terminologijo, tretji pa lušči stavke, v katerih se nahajata pojem in njegova nadpomenka iz semantičnega leksikona wordnet. Metodologijo smo preizkusili na primeru področja jezikovnih tehnologij. Za namene modeliranja izbranega področja smo zgradili primerljivi slovensko-angleški Korpus jezikovnih tehnologij, izluščene kandidate pa smo uporabili pri gradnji Glosarja jezikovnih tehnologij. Celotno metodologijo smo strnili v prosto dostopen delotok, implementiran v spletnem okolju za gradnjo delotokov Clowdflows. V delotok lahko uporabnik prek spleta naloži korpus v različnih formatih, ga jezikoslovno označi, izlušči terminologijo in kandidate za definicije ter rezultate vizualizira ali shrani. |
| format | Article |
| id | doaj-art-fe4073ffd9e74c509116540f2d876db7 |
| institution | DOAJ |
| issn | 2335-2736 |
| language | English |
| publishDate | 2014-12-01 |
| publisher | University of Ljubljana Press (Založba Univerze v Ljubljani) |
| record_format | Article |
| series | Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave |
| spelling | doaj-art-fe4073ffd9e74c509116540f2d876db72025-08-20T03:11:39ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362014-12-012110.4312/slo2.0.2014.1.1-40Luščenje definicijskih kandidatov iz specializiranih korpusovSenja Pollak0Institut “Jožef Stefan”, Odsek za tehnologije znanjaPredstavljamo metodo za luščenje definicij iz specializiranih korpusov. Metoda je bila razvita za slovenščino in angleščino, sestavljajo pa jo trije pristopi: v prvem definicije luščimo z leksikoskladenjskimi vzorci, drugi uporablja avtomatsko izluščeno terminologijo, tretji pa lušči stavke, v katerih se nahajata pojem in njegova nadpomenka iz semantičnega leksikona wordnet. Metodologijo smo preizkusili na primeru področja jezikovnih tehnologij. Za namene modeliranja izbranega področja smo zgradili primerljivi slovensko-angleški Korpus jezikovnih tehnologij, izluščene kandidate pa smo uporabili pri gradnji Glosarja jezikovnih tehnologij. Celotno metodologijo smo strnili v prosto dostopen delotok, implementiran v spletnem okolju za gradnjo delotokov Clowdflows. V delotok lahko uporabnik prek spleta naloži korpus v različnih formatih, ga jezikoslovno označi, izlušči terminologijo in kandidate za definicije ter rezultate vizualizira ali shrani.https://journals.uni-lj.si/slovenscina2/article/view/6932luščenje definicijspletni delotokijezikovne tehnologijeprocesiranje naravnega jezikaluščenje znanja iz korpusovavtomatizacija terminografskih postopkov |
| spellingShingle | Senja Pollak Luščenje definicijskih kandidatov iz specializiranih korpusov Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave luščenje definicij spletni delotoki jezikovne tehnologije procesiranje naravnega jezika luščenje znanja iz korpusov avtomatizacija terminografskih postopkov |
| title | Luščenje definicijskih kandidatov iz specializiranih korpusov |
| title_full | Luščenje definicijskih kandidatov iz specializiranih korpusov |
| title_fullStr | Luščenje definicijskih kandidatov iz specializiranih korpusov |
| title_full_unstemmed | Luščenje definicijskih kandidatov iz specializiranih korpusov |
| title_short | Luščenje definicijskih kandidatov iz specializiranih korpusov |
| title_sort | luscenje definicijskih kandidatov iz specializiranih korpusov |
| topic | luščenje definicij spletni delotoki jezikovne tehnologije procesiranje naravnega jezika luščenje znanja iz korpusov avtomatizacija terminografskih postopkov |
| url | https://journals.uni-lj.si/slovenscina2/article/view/6932 |
| work_keys_str_mv | AT senjapollak luscenjedefinicijskihkandidatovizspecializiranihkorpusov |