Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses

Strojno prevajanje je področje računalniške lingvistike, ki raziskuje uporabo programske opreme za prevajanje besedila iz enega jezika v drugega. Faktorsko statistično strojno prevajanje je različica statističnega, pri katerem besedilu dodamo jezikoslovne oznake na ravni besed in jih spremenimo v ve...

Full description

Saved in:
Bibliographic Details
Main Authors: Sašo Kuntarič, Simon Krek, Marko Robnik Šikonja
Format: Article
Language:English
Published: University of Ljubljana Press (Založba Univerze v Ljubljani) 2017-03-01
Series:Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
Subjects:
Online Access:https://journals.uni-lj.si/slovenscina2/article/view/7775
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849701414053347328
author Sašo Kuntarič
Simon Krek
Marko Robnik Šikonja
author_facet Sašo Kuntarič
Simon Krek
Marko Robnik Šikonja
author_sort Sašo Kuntarič
collection DOAJ
description Strojno prevajanje je področje računalniške lingvistike, ki raziskuje uporabo programske opreme za prevajanje besedila iz enega jezika v drugega. Faktorsko statistično strojno prevajanje je različica statističnega, pri katerem besedilu dodamo jezikoslovne oznake na ravni besed in jih spremenimo v vektorje. Tako želimo izboljšati kakovost dobljenih prevodov. V prispevku opišemo uporabo odprtokodnega sistema Moses za faktorsko statistično strojno prevajanje iz angleščine v slovenščino. Iz besedilnega korpusa smo ustvarili več faktorskih in nefaktorskih prevajalnih modelov. Z njimi smo prevedli dve besedili s področja informacijskih tehnologij. Prvo je usmerjeno tržno in ima kompleksnejšo zgradbo, drugo pa je bolj tehnične narave. Prevode, ki smo jih dobili, smo na dva načina primerjali z dvema neodvisnima človeškima prevodoma in s prevodom, ki smo ga ustvarili s storitvijo Google Translate. Za prvi način primerjave smo uporabili metriko BLEU, za drugega pa so prevode pregledali človeški pregledovalci in podali subjektivno oceno, ki je pri prevajanju še vedno zelo pomembna. Čeprav rezultatov ne moremo primerjati neposredno zaradi različnih metrik, se gibanje ocen kakovosti pri obeh besedilih dobro ujema. Edina občutna razlika med računalniško in človeško oceno se pojavi pri prehodu na faktorske modele pri drugem besedilu. Analizirali smo zanesljivost ocenjevalcev in rezultate ocenjevanja. Ugotovili smo, da so naši modeli primernejši za tehnična besedila in da uporaba faktorskih modelov vidneje izboljša prevajanje kompleksnejših besedil.
format Article
id doaj-art-e12734a993dc4154b348d5340c1e9d78
institution DOAJ
issn 2335-2736
language English
publishDate 2017-03-01
publisher University of Ljubljana Press (Založba Univerze v Ljubljani)
record_format Article
series Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
spelling doaj-art-e12734a993dc4154b348d5340c1e9d782025-08-20T03:17:57ZengUniversity of Ljubljana Press (Založba Univerze v Ljubljani)Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave2335-27362017-03-015110.4312/slo2.0.2017.1.1-26Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem MosesSašo KuntaričSimon KrekMarko Robnik ŠikonjaStrojno prevajanje je področje računalniške lingvistike, ki raziskuje uporabo programske opreme za prevajanje besedila iz enega jezika v drugega. Faktorsko statistično strojno prevajanje je različica statističnega, pri katerem besedilu dodamo jezikoslovne oznake na ravni besed in jih spremenimo v vektorje. Tako želimo izboljšati kakovost dobljenih prevodov. V prispevku opišemo uporabo odprtokodnega sistema Moses za faktorsko statistično strojno prevajanje iz angleščine v slovenščino. Iz besedilnega korpusa smo ustvarili več faktorskih in nefaktorskih prevajalnih modelov. Z njimi smo prevedli dve besedili s področja informacijskih tehnologij. Prvo je usmerjeno tržno in ima kompleksnejšo zgradbo, drugo pa je bolj tehnične narave. Prevode, ki smo jih dobili, smo na dva načina primerjali z dvema neodvisnima človeškima prevodoma in s prevodom, ki smo ga ustvarili s storitvijo Google Translate. Za prvi način primerjave smo uporabili metriko BLEU, za drugega pa so prevode pregledali človeški pregledovalci in podali subjektivno oceno, ki je pri prevajanju še vedno zelo pomembna. Čeprav rezultatov ne moremo primerjati neposredno zaradi različnih metrik, se gibanje ocen kakovosti pri obeh besedilih dobro ujema. Edina občutna razlika med računalniško in človeško oceno se pojavi pri prehodu na faktorske modele pri drugem besedilu. Analizirali smo zanesljivost ocenjevalcev in rezultate ocenjevanja. Ugotovili smo, da so naši modeli primernejši za tehnična besedila in da uporaba faktorskih modelov vidneje izboljša prevajanje kompleksnejših besedil.https://journals.uni-lj.si/slovenscina2/article/view/7775statistično strojno prevajanjefaktorsko strojno prevajanjesistem MosesBLEUčloveška evalvacija
spellingShingle Sašo Kuntarič
Simon Krek
Marko Robnik Šikonja
Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
Slovenščina 2.0: Empirične, aplikativne in interdisciplinarne raziskave
statistično strojno prevajanje
faktorsko strojno prevajanje
sistem Moses
BLEU
človeška evalvacija
title Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
title_full Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
title_fullStr Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
title_full_unstemmed Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
title_short Primerjava običajnih in faktorskih modelov pri statističnem strojnem prevajanju iz angleščine v slovenščino z orodjem Moses
title_sort primerjava obicajnih in faktorskih modelov pri statisticnem strojnem prevajanju iz anglescine v slovenscino z orodjem moses
topic statistično strojno prevajanje
faktorsko strojno prevajanje
sistem Moses
BLEU
človeška evalvacija
url https://journals.uni-lj.si/slovenscina2/article/view/7775
work_keys_str_mv AT sasokuntaric primerjavaobicajnihinfaktorskihmodelovpristatisticnemstrojnemprevajanjuizanglescinevslovenscinozorodjemmoses
AT simonkrek primerjavaobicajnihinfaktorskihmodelovpristatisticnemstrojnemprevajanjuizanglescinevslovenscinozorodjemmoses
AT markorobniksikonja primerjavaobicajnihinfaktorskihmodelovpristatisticnemstrojnemprevajanjuizanglescinevslovenscinozorodjemmoses