Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN

Merebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti...

Full description

Saved in:
Bibliographic Details
Main Author: Budi Nugroho
Format: Article
Language:Indonesian
Published: University of Brawijaya 2021-03-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1823860702413062144
author Budi Nugroho
author_facet Budi Nugroho
author_sort Budi Nugroho
collection DOAJ
description Merebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti. Kajian ini dimaksudkan untuk menganalisis dan memetakan topik penelitian yang  sedang dan/atau  telah dilakukan selama kurun waktu terjadinya pandemi  Covid-19 di tanah air. Analisis dan pemetaan dilakukan dengan menerapkan algoritma kernel k-means untuk klastering dokumen berbasis graf bipartit dan k-means pada matriks dokumen-istilah. Dataset penelitian Covid-19 Ristekbrin dimodelkan sebagai graf bipartit antara daftar istilah dengan dokumennya. Selanjutnya skor kemiripan dihitung dengan metode kernel. Nilai matriks kernel yang mencerminkan skor kemiripan antar dokumen digunakan sebagai masukan bagi algoritma klastering kernel k-means yang memberikan hasil berupa pemetaan topik penelitian. Sebagai pembanding, algoritma k-means diterapkan pada matriks dokumen-istilah untuk klastering topik penelitian Covid-19. Dari kedua metode tersebut, hasil klastering diuji dengan validasi internal menggunakan indeks Dunn. Indeks Dunn digunakan karena dalam dataset tidak tersedia informasi awal mengenai label atau nama dari masing-masing klaster. Hasil penelitian ini menunjukkan bahwa algoritma  kernel k-means memberikan validasi yang sedikit lebih baik dibandingkan dengan k-means. Hasil kajian ini diharapkan dapat memberikan tambahan informasi yang mendukung program pemerintah dalam mempercepat penanganan Covid-19 di Indonesia.   Abstract The outbreak concerning  the Covid-19 case in Indonesia has raised various topics of research carried out by researchers in diverse fields and from many institutions. Based on data compiled by the Sinta Ristekbrin portal, 351 research topics have been uploaded by researchers. This study is aimed to analyze and map research topics that are being and/or have been conducted during the period of the Covid-19 pandemic in Indonesia. Analysis and mapping are accomplished by applying the kernel k-means algorithm for document clustering based on bipartite graphs and k-means on document term matrix. Ristekbrin's Covid-19 research dataset is modeled as a bipartite graph between terms and documents. Furthermore, the similarity score is calculated using the kernel method. The kernel matrix value that represents the similarity score between documents is used as input for the kernel k-means clustering algorithm, which provides the results of mapping research topics. As comparison, we applied original k-means algorithm on the document-term matrix of the dataset. From these two methods, the clustering results were validated using Dunn index as an internal validation. The Dunn index was used because the dataset did not provide initial information regarding the label or name of each clusters..The comparison Dunn index shows that the kernel k-means algorithm outperforms than the k-means algorithm. This study is expected to provide additional information that supports government programs in accelerating the handling of Covid-19 in Indonesia..
format Article
id doaj-art-06161aafb42949949ef5a92579d65677
institution Kabale University
issn 2355-7699
2528-6579
language Indonesian
publishDate 2021-03-01
publisher University of Brawijaya
record_format Article
series Jurnal Teknologi Informasi dan Ilmu Komputer
spelling doaj-art-06161aafb42949949ef5a92579d656772025-02-10T10:41:44ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792021-03-018210.25126/jtiik.2021824365703Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRINBudi Nugroho0Pusat Penelitian Informatika - LIPIMerebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti. Kajian ini dimaksudkan untuk menganalisis dan memetakan topik penelitian yang  sedang dan/atau  telah dilakukan selama kurun waktu terjadinya pandemi  Covid-19 di tanah air. Analisis dan pemetaan dilakukan dengan menerapkan algoritma kernel k-means untuk klastering dokumen berbasis graf bipartit dan k-means pada matriks dokumen-istilah. Dataset penelitian Covid-19 Ristekbrin dimodelkan sebagai graf bipartit antara daftar istilah dengan dokumennya. Selanjutnya skor kemiripan dihitung dengan metode kernel. Nilai matriks kernel yang mencerminkan skor kemiripan antar dokumen digunakan sebagai masukan bagi algoritma klastering kernel k-means yang memberikan hasil berupa pemetaan topik penelitian. Sebagai pembanding, algoritma k-means diterapkan pada matriks dokumen-istilah untuk klastering topik penelitian Covid-19. Dari kedua metode tersebut, hasil klastering diuji dengan validasi internal menggunakan indeks Dunn. Indeks Dunn digunakan karena dalam dataset tidak tersedia informasi awal mengenai label atau nama dari masing-masing klaster. Hasil penelitian ini menunjukkan bahwa algoritma  kernel k-means memberikan validasi yang sedikit lebih baik dibandingkan dengan k-means. Hasil kajian ini diharapkan dapat memberikan tambahan informasi yang mendukung program pemerintah dalam mempercepat penanganan Covid-19 di Indonesia.   Abstract The outbreak concerning  the Covid-19 case in Indonesia has raised various topics of research carried out by researchers in diverse fields and from many institutions. Based on data compiled by the Sinta Ristekbrin portal, 351 research topics have been uploaded by researchers. This study is aimed to analyze and map research topics that are being and/or have been conducted during the period of the Covid-19 pandemic in Indonesia. Analysis and mapping are accomplished by applying the kernel k-means algorithm for document clustering based on bipartite graphs and k-means on document term matrix. Ristekbrin's Covid-19 research dataset is modeled as a bipartite graph between terms and documents. Furthermore, the similarity score is calculated using the kernel method. The kernel matrix value that represents the similarity score between documents is used as input for the kernel k-means clustering algorithm, which provides the results of mapping research topics. As comparison, we applied original k-means algorithm on the document-term matrix of the dataset. From these two methods, the clustering results were validated using Dunn index as an internal validation. The Dunn index was used because the dataset did not provide initial information regarding the label or name of each clusters..The comparison Dunn index shows that the kernel k-means algorithm outperforms than the k-means algorithm. This study is expected to provide additional information that supports government programs in accelerating the handling of Covid-19 in Indonesia.. https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
spellingShingle Budi Nugroho
Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
Jurnal Teknologi Informasi dan Ilmu Komputer
title Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_full Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_fullStr Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_full_unstemmed Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_short Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_sort perbandingan aplikasi algoritma kernel k means pada graf bipartit dan k means pada matriks dokumen istilah dalam dataset penelitian covid 19 ristekbrin
url https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
work_keys_str_mv AT budinugroho perbandinganaplikasialgoritmakernelkmeanspadagrafbipartitdankmeanspadamatriksdokumenistilahdalamdatasetpenelitiancovid19ristekbrin