Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering

Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tida...

Full description

Saved in:
Bibliographic Details
Main Authors: Tesa Eranti Putri, Yuita Arum Sari, Anggi Gustiningsih Hapsani
Format: Article
Language:English
Published: politeknik negeri malang 2018-06-01
Series:Jurnal Informatika dan Multimedia
Online Access:https://jurnal.polinema.ac.id/index.php/jtim/article/view/598
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1850273329995317248
author Tesa Eranti Putri
Yuita Arum Sari
Anggi Gustiningsih Hapsani
author_facet Tesa Eranti Putri
Yuita Arum Sari
Anggi Gustiningsih Hapsani
author_sort Tesa Eranti Putri
collection DOAJ
description Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tidak teratur sehingga perlu dilakukan pengelompokan berita sesuai dengan kontennya. Pengelompokanberita sesuai content dapat membantu pembaca untuk membaca berita dengan topiktertentu sesuai dengan minatnya. Proses pengelompokan informasi berita diimplementasikan denganbeberapa tahap, yaitu preprocessing dan pengelompokan dokumen. Preprocessing dilakukan dengan mengimplementasikan metode kombinasi reduksi fitur Document Frequency (DF) dan Information Gain (IG) Thresholding dalamSingular Value Decomposition (SVD). Algoritme SVD dipilih karena memiliki kemampuan untuk melakukan dekomposisi pada matriks dokumen-term, sehingga diperoleh matriks yang masih menyimpan informasi penting dengan ukuran dimensi yang lebih kecil.Pada tahap pengelompokan dokumen berita dilakukandengan algoritme Fuzzy C-Means. Hasil uji coba akurasipengelompokan dokumen berita menunjukkan bahwa pengelompokan yang dilakukan memberikan hasil pengkategorian yang cukup akurat dengan tingkat akurasi rata-rata 74,5 % (IG threshold 0.5, k = 5). Hal tersebut menunjukkan bahwa pengelompokan dokumen menggunakan IG dan SVD dengan FUZZY C-MEANS adalah sesuai dengan kebutuhan.
format Article
id doaj-art-dcc161fddc3a430ba7a70dd05a97ee8d
institution OA Journals
issn 2252-486X
2548-4710
language English
publishDate 2018-06-01
publisher politeknik negeri malang
record_format Article
series Jurnal Informatika dan Multimedia
spelling doaj-art-dcc161fddc3a430ba7a70dd05a97ee8d2025-08-20T01:51:31Zengpoliteknik negeri malangJurnal Informatika dan Multimedia2252-486X2548-47102018-06-0110110.33795/jim.v10i1.598Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClusteringTesa Eranti PutriYuita Arum SariAnggi Gustiningsih Hapsani Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tidak teratur sehingga perlu dilakukan pengelompokan berita sesuai dengan kontennya. Pengelompokanberita sesuai content dapat membantu pembaca untuk membaca berita dengan topiktertentu sesuai dengan minatnya. Proses pengelompokan informasi berita diimplementasikan denganbeberapa tahap, yaitu preprocessing dan pengelompokan dokumen. Preprocessing dilakukan dengan mengimplementasikan metode kombinasi reduksi fitur Document Frequency (DF) dan Information Gain (IG) Thresholding dalamSingular Value Decomposition (SVD). Algoritme SVD dipilih karena memiliki kemampuan untuk melakukan dekomposisi pada matriks dokumen-term, sehingga diperoleh matriks yang masih menyimpan informasi penting dengan ukuran dimensi yang lebih kecil.Pada tahap pengelompokan dokumen berita dilakukandengan algoritme Fuzzy C-Means. Hasil uji coba akurasipengelompokan dokumen berita menunjukkan bahwa pengelompokan yang dilakukan memberikan hasil pengkategorian yang cukup akurat dengan tingkat akurasi rata-rata 74,5 % (IG threshold 0.5, k = 5). Hal tersebut menunjukkan bahwa pengelompokan dokumen menggunakan IG dan SVD dengan FUZZY C-MEANS adalah sesuai dengan kebutuhan. https://jurnal.polinema.ac.id/index.php/jtim/article/view/598
spellingShingle Tesa Eranti Putri
Yuita Arum Sari
Anggi Gustiningsih Hapsani
Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
Jurnal Informatika dan Multimedia
title Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
title_full Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
title_fullStr Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
title_full_unstemmed Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
title_short Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
title_sort pengelompokan dokumen berita berbahasa indonesia menggunakan reduksi fiturinformation gain dan singular value decomposition dalam fuzzy c meansclustering
url https://jurnal.polinema.ac.id/index.php/jtim/article/view/598
work_keys_str_mv AT tesaerantiputri pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering
AT yuitaarumsari pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering
AT anggigustiningsihhapsani pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering