Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest

Stres merupakan keadaan dimana seseorang merasakan adanya tekanan yang berlebih pada dirinya. Pemantauan tingkat stres menjadi hal yang penting bagi manusia. Tingkat stres yang tinggi dapat menimbulkan dampak negatif terhadap kesehatan manusia. Deteksi dini stres menjadi sesuatu yang sangat penting...

Full description

Saved in:
Bibliographic Details
Main Authors: Naufal Fathirachman Mahing, Alifi Lazuardi Gunawan, Ahmad Foresta Azhar Zen, Fitra Abdurrachman Bachtiar, Satrio Agung Wicaksono
Format: Article
Language:Indonesian
Published: University of Brawijaya 2024-10-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Subjects:
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/8010
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1823858601155887104
author Naufal Fathirachman Mahing
Alifi Lazuardi Gunawan
Ahmad Foresta Azhar Zen
Fitra Abdurrachman Bachtiar
Satrio Agung Wicaksono
author_facet Naufal Fathirachman Mahing
Alifi Lazuardi Gunawan
Ahmad Foresta Azhar Zen
Fitra Abdurrachman Bachtiar
Satrio Agung Wicaksono
author_sort Naufal Fathirachman Mahing
collection DOAJ
description Stres merupakan keadaan dimana seseorang merasakan adanya tekanan yang berlebih pada dirinya. Pemantauan tingkat stres menjadi hal yang penting bagi manusia. Tingkat stres yang tinggi dapat menimbulkan dampak negatif terhadap kesehatan manusia. Deteksi dini stres menjadi sesuatu yang sangat penting untuk dilakukan. Salah satu cara mengetahui tingkat stres seseorang adalah melalui analisis teks. Penelitian ini dilakukan untuk melakukan klasifikasi tingkat stres berdasarkan data berupa teks menggunakan algoritma Support Vector Machine (SVM) dan Random Forest. Pada penelitian ini melakukan perbandingan beberapa metode transformasi. Transformasi yang dilakukan pada penelitian ini menggunakan TF-IDF, CountVectorizer, NRCLex, dan Word Affect Intensities. Data yang digunakan dalam penelitian ini berupa sebuat teks berbahasa Inggris yang diambil dari media sosial Twitter. Total data yang digunakan yaitu 8439 data. Pelatihan model baik untuk Support Vector Machine dan Random Forest menggunakan 6751 data. Sedangkan untuk pengujian menggunakan 1688 data. Hasil penelitian menunjukkan bahwa algoritma SVM dengan pembobotan menggunakan TF-IDF memiliki performa yang paling baik dibandingkan dengan algoritma Random Forest dan metode transformasi lainnya yang digunakan dalam penelitian. Model algoritma SVM dengan transformasi TF-IDF yang dibangun berhasil mendapatkan akurasi sebesar 84%. Model ini mendapatkan akurasi yang lebih tinggi dibanding model Random Forest yang memperoleh akurasi tinggi sebesar 80% dengan menggunakan transformasi CountVectorizer.   Abstract Stress is a condition where a person feels excessive pressure on himself. Monitoring stress levels is important for humans. High levels of stress can have a negative impact on human health. Early detection of stress is something that is very important to do. One way to find out someone's stress level is through text analysis.This research was conducted to classify stress levels based on text data using the Support Vector Machine (SVM) and Random Forest algorithms. This research compares several transformation methods. The transformation performed in this study uses TF-IDF, CountVectorizer, NRCLex, and Word Affect Intensities. The data used in this research is an English text taken from Twitter social media. The total data used is 8439 data. Model training for both Support Vector Machine and Random Forest uses 6751 data. While for testing using 1688 data. The results showed that the SVM algorithm with weighting using TF-IDF had the best performance compared to the Random Forest algorithm and other transformation methods used in the study. The SVM algorithm model with TF-IDF transformation that was built managed to get an accuracy of 84%. This model obtained a higher accuracy than the Random Forest model which obtained a high accuracy of 80% using the CountVectorizer transformation.
format Article
id doaj-art-0faeae930df340eca14cfc266b1ac3d5
institution Kabale University
issn 2355-7699
2528-6579
language Indonesian
publishDate 2024-10-01
publisher University of Brawijaya
record_format Article
series Jurnal Teknologi Informasi dan Ilmu Komputer
spelling doaj-art-0faeae930df340eca14cfc266b1ac3d52025-02-11T10:36:59ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792024-10-0111510.25126/jtiik.1078010Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random ForestNaufal Fathirachman Mahing0Alifi Lazuardi Gunawan1Ahmad Foresta Azhar Zen2Fitra Abdurrachman Bachtiar3Satrio Agung Wicaksono4Universitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, Malang Stres merupakan keadaan dimana seseorang merasakan adanya tekanan yang berlebih pada dirinya. Pemantauan tingkat stres menjadi hal yang penting bagi manusia. Tingkat stres yang tinggi dapat menimbulkan dampak negatif terhadap kesehatan manusia. Deteksi dini stres menjadi sesuatu yang sangat penting untuk dilakukan. Salah satu cara mengetahui tingkat stres seseorang adalah melalui analisis teks. Penelitian ini dilakukan untuk melakukan klasifikasi tingkat stres berdasarkan data berupa teks menggunakan algoritma Support Vector Machine (SVM) dan Random Forest. Pada penelitian ini melakukan perbandingan beberapa metode transformasi. Transformasi yang dilakukan pada penelitian ini menggunakan TF-IDF, CountVectorizer, NRCLex, dan Word Affect Intensities. Data yang digunakan dalam penelitian ini berupa sebuat teks berbahasa Inggris yang diambil dari media sosial Twitter. Total data yang digunakan yaitu 8439 data. Pelatihan model baik untuk Support Vector Machine dan Random Forest menggunakan 6751 data. Sedangkan untuk pengujian menggunakan 1688 data. Hasil penelitian menunjukkan bahwa algoritma SVM dengan pembobotan menggunakan TF-IDF memiliki performa yang paling baik dibandingkan dengan algoritma Random Forest dan metode transformasi lainnya yang digunakan dalam penelitian. Model algoritma SVM dengan transformasi TF-IDF yang dibangun berhasil mendapatkan akurasi sebesar 84%. Model ini mendapatkan akurasi yang lebih tinggi dibanding model Random Forest yang memperoleh akurasi tinggi sebesar 80% dengan menggunakan transformasi CountVectorizer.   Abstract Stress is a condition where a person feels excessive pressure on himself. Monitoring stress levels is important for humans. High levels of stress can have a negative impact on human health. Early detection of stress is something that is very important to do. One way to find out someone's stress level is through text analysis.This research was conducted to classify stress levels based on text data using the Support Vector Machine (SVM) and Random Forest algorithms. This research compares several transformation methods. The transformation performed in this study uses TF-IDF, CountVectorizer, NRCLex, and Word Affect Intensities. The data used in this research is an English text taken from Twitter social media. The total data used is 8439 data. Model training for both Support Vector Machine and Random Forest uses 6751 data. While for testing using 1688 data. The results showed that the SVM algorithm with weighting using TF-IDF had the best performance compared to the Random Forest algorithm and other transformation methods used in the study. The SVM algorithm model with TF-IDF transformation that was built managed to get an accuracy of 84%. This model obtained a higher accuracy than the Random Forest model which obtained a high accuracy of 80% using the CountVectorizer transformation. https://jtiik.ub.ac.id/index.php/jtiik/article/view/8010stresSVMrandom forestklasifikasi teksword affect intensities
spellingShingle Naufal Fathirachman Mahing
Alifi Lazuardi Gunawan
Ahmad Foresta Azhar Zen
Fitra Abdurrachman Bachtiar
Satrio Agung Wicaksono
Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
Jurnal Teknologi Informasi dan Ilmu Komputer
stres
SVM
random forest
klasifikasi teks
word affect intensities
title Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
title_full Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
title_fullStr Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
title_full_unstemmed Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
title_short Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest
title_sort klasifikasi tingkat stress dari data berbentuk teks dengan menggunakan algoritma support vector machine svm dan random forest
topic stres
SVM
random forest
klasifikasi teks
word affect intensities
url https://jtiik.ub.ac.id/index.php/jtiik/article/view/8010
work_keys_str_mv AT naufalfathirachmanmahing klasifikasitingkatstressdaridataberbentukteksdenganmenggunakanalgoritmasupportvectormachinesvmdanrandomforest
AT alifilazuardigunawan klasifikasitingkatstressdaridataberbentukteksdenganmenggunakanalgoritmasupportvectormachinesvmdanrandomforest
AT ahmadforestaazharzen klasifikasitingkatstressdaridataberbentukteksdenganmenggunakanalgoritmasupportvectormachinesvmdanrandomforest
AT fitraabdurrachmanbachtiar klasifikasitingkatstressdaridataberbentukteksdenganmenggunakanalgoritmasupportvectormachinesvmdanrandomforest
AT satrioagungwicaksono klasifikasitingkatstressdaridataberbentukteksdenganmenggunakanalgoritmasupportvectormachinesvmdanrandomforest