Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering
Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tida...
Saved in:
| Main Authors: | , , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
politeknik negeri malang
2018-06-01
|
| Series: | Jurnal Informatika dan Multimedia |
| Online Access: | https://jurnal.polinema.ac.id/index.php/jtim/article/view/598 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1850273329995317248 |
|---|---|
| author | Tesa Eranti Putri Yuita Arum Sari Anggi Gustiningsih Hapsani |
| author_facet | Tesa Eranti Putri Yuita Arum Sari Anggi Gustiningsih Hapsani |
| author_sort | Tesa Eranti Putri |
| collection | DOAJ |
| description |
Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tidak teratur sehingga perlu dilakukan pengelompokan berita sesuai dengan kontennya. Pengelompokanberita sesuai content dapat membantu pembaca untuk membaca berita dengan topiktertentu sesuai dengan minatnya. Proses pengelompokan informasi berita diimplementasikan denganbeberapa tahap, yaitu preprocessing dan pengelompokan dokumen. Preprocessing dilakukan dengan mengimplementasikan metode kombinasi reduksi fitur Document Frequency (DF) dan Information Gain (IG) Thresholding dalamSingular Value Decomposition (SVD). Algoritme SVD dipilih karena memiliki kemampuan untuk melakukan dekomposisi pada matriks dokumen-term, sehingga diperoleh matriks yang masih menyimpan informasi penting dengan ukuran dimensi yang lebih kecil.Pada tahap pengelompokan dokumen berita dilakukandengan algoritme Fuzzy C-Means. Hasil uji coba akurasipengelompokan dokumen berita menunjukkan bahwa pengelompokan yang dilakukan memberikan hasil pengkategorian yang cukup akurat dengan tingkat akurasi rata-rata 74,5 % (IG threshold 0.5, k = 5). Hal tersebut menunjukkan bahwa pengelompokan dokumen menggunakan IG dan SVD dengan FUZZY C-MEANS adalah sesuai dengan kebutuhan.
|
| format | Article |
| id | doaj-art-dcc161fddc3a430ba7a70dd05a97ee8d |
| institution | OA Journals |
| issn | 2252-486X 2548-4710 |
| language | English |
| publishDate | 2018-06-01 |
| publisher | politeknik negeri malang |
| record_format | Article |
| series | Jurnal Informatika dan Multimedia |
| spelling | doaj-art-dcc161fddc3a430ba7a70dd05a97ee8d2025-08-20T01:51:31Zengpoliteknik negeri malangJurnal Informatika dan Multimedia2252-486X2548-47102018-06-0110110.33795/jim.v10i1.598Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClusteringTesa Eranti PutriYuita Arum SariAnggi Gustiningsih Hapsani Koran dan berita online merupakan media informasi digital saat ini yang proses pembaruan informasinya sangat mudah dan fleksibel. Kemudahan ini memungkinkan penulis berita untuk mengunggah informasi baru di waktu kapanpun dan dimanapun. Hal ini menyebabkan data dokumen berita sangat banyak dan tidak teratur sehingga perlu dilakukan pengelompokan berita sesuai dengan kontennya. Pengelompokanberita sesuai content dapat membantu pembaca untuk membaca berita dengan topiktertentu sesuai dengan minatnya. Proses pengelompokan informasi berita diimplementasikan denganbeberapa tahap, yaitu preprocessing dan pengelompokan dokumen. Preprocessing dilakukan dengan mengimplementasikan metode kombinasi reduksi fitur Document Frequency (DF) dan Information Gain (IG) Thresholding dalamSingular Value Decomposition (SVD). Algoritme SVD dipilih karena memiliki kemampuan untuk melakukan dekomposisi pada matriks dokumen-term, sehingga diperoleh matriks yang masih menyimpan informasi penting dengan ukuran dimensi yang lebih kecil.Pada tahap pengelompokan dokumen berita dilakukandengan algoritme Fuzzy C-Means. Hasil uji coba akurasipengelompokan dokumen berita menunjukkan bahwa pengelompokan yang dilakukan memberikan hasil pengkategorian yang cukup akurat dengan tingkat akurasi rata-rata 74,5 % (IG threshold 0.5, k = 5). Hal tersebut menunjukkan bahwa pengelompokan dokumen menggunakan IG dan SVD dengan FUZZY C-MEANS adalah sesuai dengan kebutuhan. https://jurnal.polinema.ac.id/index.php/jtim/article/view/598 |
| spellingShingle | Tesa Eranti Putri Yuita Arum Sari Anggi Gustiningsih Hapsani Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering Jurnal Informatika dan Multimedia |
| title | Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering |
| title_full | Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering |
| title_fullStr | Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering |
| title_full_unstemmed | Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering |
| title_short | Pengelompokan Dokumen Berita Berbahasa Indonesia Menggunakan Reduksi FiturInformation Gain dan Singular Value Decomposition dalam Fuzzy C-MeansClustering |
| title_sort | pengelompokan dokumen berita berbahasa indonesia menggunakan reduksi fiturinformation gain dan singular value decomposition dalam fuzzy c meansclustering |
| url | https://jurnal.polinema.ac.id/index.php/jtim/article/view/598 |
| work_keys_str_mv | AT tesaerantiputri pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering AT yuitaarumsari pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering AT anggigustiningsihhapsani pengelompokandokumenberitaberbahasaindonesiamenggunakanreduksifiturinformationgaindansingularvaluedecompositiondalamfuzzycmeansclustering |