Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN

Merebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti...

Full description

Saved in:

Bibliographic Details
Main Author:	Budi Nugroho
Format:	Article
Language:	Indonesian
Published:	University of Brawijaya 2021-03-01
Series:	Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:	https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
Tags:	Add Tag No Tags, Be the first to tag this record!

_version_	1823860702413062144
author	Budi Nugroho
author_facet	Budi Nugroho
author_sort	Budi Nugroho
collection	DOAJ
description	Merebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti. Kajian ini dimaksudkan untuk menganalisis dan memetakan topik penelitian yang sedang dan/atau telah dilakukan selama kurun waktu terjadinya pandemi Covid-19 di tanah air. Analisis dan pemetaan dilakukan dengan menerapkan algoritma kernel k-means untuk klastering dokumen berbasis graf bipartit dan k-means pada matriks dokumen-istilah. Dataset penelitian Covid-19 Ristekbrin dimodelkan sebagai graf bipartit antara daftar istilah dengan dokumennya. Selanjutnya skor kemiripan dihitung dengan metode kernel. Nilai matriks kernel yang mencerminkan skor kemiripan antar dokumen digunakan sebagai masukan bagi algoritma klastering kernel k-means yang memberikan hasil berupa pemetaan topik penelitian. Sebagai pembanding, algoritma k-means diterapkan pada matriks dokumen-istilah untuk klastering topik penelitian Covid-19. Dari kedua metode tersebut, hasil klastering diuji dengan validasi internal menggunakan indeks Dunn. Indeks Dunn digunakan karena dalam dataset tidak tersedia informasi awal mengenai label atau nama dari masing-masing klaster. Hasil penelitian ini menunjukkan bahwa algoritma kernel k-means memberikan validasi yang sedikit lebih baik dibandingkan dengan k-means. Hasil kajian ini diharapkan dapat memberikan tambahan informasi yang mendukung program pemerintah dalam mempercepat penanganan Covid-19 di Indonesia. Abstract The outbreak concerning the Covid-19 case in Indonesia has raised various topics of research carried out by researchers in diverse fields and from many institutions. Based on data compiled by the Sinta Ristekbrin portal, 351 research topics have been uploaded by researchers. This study is aimed to analyze and map research topics that are being and/or have been conducted during the period of the Covid-19 pandemic in Indonesia. Analysis and mapping are accomplished by applying the kernel k-means algorithm for document clustering based on bipartite graphs and k-means on document term matrix. Ristekbrin's Covid-19 research dataset is modeled as a bipartite graph between terms and documents. Furthermore, the similarity score is calculated using the kernel method. The kernel matrix value that represents the similarity score between documents is used as input for the kernel k-means clustering algorithm, which provides the results of mapping research topics. As comparison, we applied original k-means algorithm on the document-term matrix of the dataset. From these two methods, the clustering results were validated using Dunn index as an internal validation. The Dunn index was used because the dataset did not provide initial information regarding the label or name of each clusters..The comparison Dunn index shows that the kernel k-means algorithm outperforms than the k-means algorithm. This study is expected to provide additional information that supports government programs in accelerating the handling of Covid-19 in Indonesia..
format	Article
id	doaj-art-06161aafb42949949ef5a92579d65677
institution	Kabale University
issn	2355-7699 2528-6579
language	Indonesian
publishDate	2021-03-01
publisher	University of Brawijaya
record_format	Article
series	Jurnal Teknologi Informasi dan Ilmu Komputer
spelling	doaj-art-06161aafb42949949ef5a92579d656772025-02-10T10:41:44ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792021-03-018210.25126/jtiik.2021824365703Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRINBudi Nugroho0Pusat Penelitian Informatika - LIPIMerebaknya kasus Covid-19 di Indonesia telah memunculkan berbagai macam topik penelitian yang dilakukan oleh para peneliti di berbagai bidang dan dari bermacam institusi. Berdasarkan data yang dihimpun oleh portal Sinta Ristekbrin, terdapat 351 topik penelitian yang telah diunggah oleh para peneliti. Kajian ini dimaksudkan untuk menganalisis dan memetakan topik penelitian yang sedang dan/atau telah dilakukan selama kurun waktu terjadinya pandemi Covid-19 di tanah air. Analisis dan pemetaan dilakukan dengan menerapkan algoritma kernel k-means untuk klastering dokumen berbasis graf bipartit dan k-means pada matriks dokumen-istilah. Dataset penelitian Covid-19 Ristekbrin dimodelkan sebagai graf bipartit antara daftar istilah dengan dokumennya. Selanjutnya skor kemiripan dihitung dengan metode kernel. Nilai matriks kernel yang mencerminkan skor kemiripan antar dokumen digunakan sebagai masukan bagi algoritma klastering kernel k-means yang memberikan hasil berupa pemetaan topik penelitian. Sebagai pembanding, algoritma k-means diterapkan pada matriks dokumen-istilah untuk klastering topik penelitian Covid-19. Dari kedua metode tersebut, hasil klastering diuji dengan validasi internal menggunakan indeks Dunn. Indeks Dunn digunakan karena dalam dataset tidak tersedia informasi awal mengenai label atau nama dari masing-masing klaster. Hasil penelitian ini menunjukkan bahwa algoritma kernel k-means memberikan validasi yang sedikit lebih baik dibandingkan dengan k-means. Hasil kajian ini diharapkan dapat memberikan tambahan informasi yang mendukung program pemerintah dalam mempercepat penanganan Covid-19 di Indonesia. Abstract The outbreak concerning the Covid-19 case in Indonesia has raised various topics of research carried out by researchers in diverse fields and from many institutions. Based on data compiled by the Sinta Ristekbrin portal, 351 research topics have been uploaded by researchers. This study is aimed to analyze and map research topics that are being and/or have been conducted during the period of the Covid-19 pandemic in Indonesia. Analysis and mapping are accomplished by applying the kernel k-means algorithm for document clustering based on bipartite graphs and k-means on document term matrix. Ristekbrin's Covid-19 research dataset is modeled as a bipartite graph between terms and documents. Furthermore, the similarity score is calculated using the kernel method. The kernel matrix value that represents the similarity score between documents is used as input for the kernel k-means clustering algorithm, which provides the results of mapping research topics. As comparison, we applied original k-means algorithm on the document-term matrix of the dataset. From these two methods, the clustering results were validated using Dunn index as an internal validation. The Dunn index was used because the dataset did not provide initial information regarding the label or name of each clusters..The comparison Dunn index shows that the kernel k-means algorithm outperforms than the k-means algorithm. This study is expected to provide additional information that supports government programs in accelerating the handling of Covid-19 in Indonesia.. https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
spellingShingle	Budi Nugroho Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN Jurnal Teknologi Informasi dan Ilmu Komputer
title	Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_full	Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_fullStr	Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_full_unstemmed	Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_short	Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN
title_sort	perbandingan aplikasi algoritma kernel k means pada graf bipartit dan k means pada matriks dokumen istilah dalam dataset penelitian covid 19 ristekbrin
url	https://jtiik.ub.ac.id/index.php/jtiik/article/view/4365
work_keys_str_mv	AT budinugroho perbandinganaplikasialgoritmakernelkmeanspadagrafbipartitdankmeanspadamatriksdokumenistilahdalamdatasetpenelitiancovid19ristekbrin

Perbandingan Aplikasi Algoritma Kernel K-Means pada Graf Bipartit dan K-Means pada Matriks Dokumen- Istilah dalam Dataset Penelitian Covid-19 RISTEKBRIN

Similar Items