MULTI-WD: Alat Kelengkapan Multibahasa untuk Data Wikidata

Wikidata adalah sebuah knowldege graph (KG) yang mengalami perkembangan sangat pesat. Hal ini disebabkan oleh dua hal. Pertama, data pada Wikidata dapat diakses dan diedit oleh siapa pun. Kedua, fitur multibahasa yang ditawarkan oleh Wikidata. Fitur multibahasa ini memungkinkan data (entitas) dalam...

Full description

Saved in:
Bibliographic Details
Main Authors: Mohammad Yani, Lilyan Arhatia Agustine, Iryanto
Format: Article
Language:English
Published: Universitas Gadjah Mada 2024-11-01
Series:Jurnal Nasional Teknik Elektro dan Teknologi Informasi
Subjects:
Online Access:https://jurnal.ugm.ac.id/v3/JNTETI/article/view/13289
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Wikidata adalah sebuah knowldege graph (KG) yang mengalami perkembangan sangat pesat. Hal ini disebabkan oleh dua hal. Pertama, data pada Wikidata dapat diakses dan diedit oleh siapa pun. Kedua, fitur multibahasa yang ditawarkan oleh Wikidata. Fitur multibahasa ini memungkinkan data (entitas) dalam Wikidata dapat diakses menggunakan berbagai bahasa di dunia. Namun, ketidaklengkapan informasi sebuah data Wikidata secara multibahasa masih menjadi isu penting dalam fitur ini. Sebagai contoh, deskripsi dari data “bada reuteuk” dengan identitas (ID) “Q100606305” hanya tersedia dalam bahasa Indonesia saja, yaitu “makanan khas di Indonesia”, tetapi tidak tersedia dalam bahasa lain. Dengan demikian, data tentang “bada reuteuk” tidak dapat dikenali dalam bahasa selain bahasa Indonesia. Untuk mengatasi permasalahan ketidaklengkapan data Wikidata secara multibahasa tersebut, diusulkan sebuah alat yang bernama MULTI-WD. Sistem ini dibangun menggunakan dua fitur utama, yaitu pemrofilan bahasa dan penerjemahan data. Pemrofilan data dilakukan menggunakan kueri SPARQL dengan memanfaatkan API Wikidata. Pemrofilan data ini berfungsi untuk menampilkan profil data Wikidata dari sisi kemultibahasaannya. Sementara itu, untuk penerjemahan data, digunakan pustaka penerjemah bernama Translated Labs. Translated Labs dipilih karena sifatnya yang terbuka dan gratis serta hasil terjemahannya yang cukup baik. Hasil terjemahan kemudian dapat disimpan ke Wikidata. Pengujian sistem dilakukan oleh lima responden dari komunitas Wikidata dengan menggunakan pendekatan black box. Hasil pengujian menunjukkan bahwa fungsi utama MULTI-WD, seperti pemilihan kategori, penampilan statistik data, penerjemahan dan pembaruan data, dapat berjalan 100% serta mencapai efisiensi penerjemahan data hingga 300%, dibandingkan dengan penerjemahan data secara manual atau langsung dari laman Wikidata.
ISSN:2301-4156
2460-5719