Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino

Prispevek predstavlja razvoj prosto dostopnih modelov za prepoznavanje in klasifikacijo imenskih enot za hrvaški in slovenski jezik. Poskusi se osredotočajo na najbolj informativne jezikovne lastnosti, pri čemer upoštevajo dostopnost jezikovnih orodij za oba jezika. Poleg standardnih jezikovnih last...

Full description

Saved in:
Bibliographic Details
Main Authors: Nikola Ljubešić, Marija Stupar, Tereza Jurić, Željko Agić
Format: Article
Language:English
Published: University of Ljubljana Press (Založba Univerze v Ljubljani) 2013-12-01
Series:Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Subjects:
Online Access:https://journals.uni-lj.si/slovenscina2/article/view/6925
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849470290264850432
author Nikola Ljubešić
Marija Stupar
Tereza Jurić
Željko Agić
author_facet Nikola Ljubešić
Marija Stupar
Tereza Jurić
Željko Agić
author_sort Nikola Ljubešić
collection DOAJ
description Prispevek predstavlja razvoj prosto dostopnih modelov za prepoznavanje in klasifikacijo imenskih enot za hrvaški in slovenski jezik. Poskusi se osredotočajo na najbolj informativne jezikovne lastnosti, pri čemer upoštevajo dostopnost jezikovnih orodij za oba jezika. Poleg standardnih jezikovnih lastnosti so upoštevane tudi distribucijske lastnosti, ki so bile izračunane iz velikih neoznačenih enojezičnih korpusov. Uporaba distribucijskih lastnosti izboljša rezultate za 7-8 točk v meri F1, uporaba oblikoslovnih informacij pa dodatno za 3-4 točke, in to pri obeh jezikih. Najboljši naučeni model skupaj s testno množico za primerjavo z obstoječimi in bodočimi sistemi ter model za oblikoslovno označevanje hrvaščine s programom HunPos so dostopni za prenos za uporabo v znanstvene in komercialne namene.
format Article
id doaj-art-5bfe69aa2dd442d9b1aa7ac2f21570c3
institution Kabale University
issn 2335-2736
language English
publishDate 2013-12-01
publisher University of Ljubljana Press (Založba Univerze v Ljubljani)
record_format Article
series Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
spelling doaj-art-5bfe69aa2dd442d9b1aa7ac2f21570c32025-08-20T03:25:11ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362013-12-011210.4312/slo2.0.2013.2.35-57Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščinoNikola Ljubešić0Marija StuparTereza Jurić1Željko Agić2University of Zagreb, Faculty of Humanities and Social Sciences, Department of Information and Communication SciencesUniversity of Zagreb, Faculty of Humanities and Social Sciences, Department of Information and Communication SciencesUniversity of Zagreb, Faculty of Humanities and Social Sciences, Department of Information and Communication SciencesPrispevek predstavlja razvoj prosto dostopnih modelov za prepoznavanje in klasifikacijo imenskih enot za hrvaški in slovenski jezik. Poskusi se osredotočajo na najbolj informativne jezikovne lastnosti, pri čemer upoštevajo dostopnost jezikovnih orodij za oba jezika. Poleg standardnih jezikovnih lastnosti so upoštevane tudi distribucijske lastnosti, ki so bile izračunane iz velikih neoznačenih enojezičnih korpusov. Uporaba distribucijskih lastnosti izboljša rezultate za 7-8 točk v meri F1, uporaba oblikoslovnih informacij pa dodatno za 3-4 točke, in to pri obeh jezikih. Najboljši naučeni model skupaj s testno množico za primerjavo z obstoječimi in bodočimi sistemi ter model za oblikoslovno označevanje hrvaščine s programom HunPos so dostopni za prenos za uporabo v znanstvene in komercialne namene.https://journals.uni-lj.si/slovenscina2/article/view/6925prepoznavanje imenskih entitetdistribucijske lastnostihrvaščinaslovenščina
spellingShingle Nikola Ljubešić
Marija Stupar
Tereza Jurić
Željko Agić
Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
prepoznavanje imenskih entitet
distribucijske lastnosti
hrvaščina
slovenščina
title Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
title_full Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
title_fullStr Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
title_full_unstemmed Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
title_short Izgradnja modelov za prepoznavanje imenskih entitet za hrvaščino in slovenščino
title_sort izgradnja modelov za prepoznavanje imenskih entitet za hrvascino in slovenscino
topic prepoznavanje imenskih entitet
distribucijske lastnosti
hrvaščina
slovenščina
url https://journals.uni-lj.si/slovenscina2/article/view/6925
work_keys_str_mv AT nikolaljubesic izgradnjamodelovzaprepoznavanjeimenskihentitetzahrvascinoinslovenscino
AT marijastupar izgradnjamodelovzaprepoznavanjeimenskihentitetzahrvascinoinslovenscino
AT terezajuric izgradnjamodelovzaprepoznavanjeimenskihentitetzahrvascinoinslovenscino
AT zeljkoagic izgradnjamodelovzaprepoznavanjeimenskihentitetzahrvascinoinslovenscino