Algoritma K-Nearest Neighbor pada Kasus Dataset Imbalanced untuk Klasifikasi Kinerja Karyawan Perusahaan

Perusahaan perlu menilai kinerja karyawan mereka untuk berbagai tujuan, termasuk promosi jabatan. Namun, data karyawan yang semakin rumit dapat membuat proses penilaian ini menjadi sulit. Penelitian ini bertujuan untuk membuat model machine learning yang dapat memprediksi apakah karyawan berpotensi...

Full description

Saved in:
Bibliographic Details
Main Authors: Fitri Nuraeni, Dede Kurniadi, Moch Haiqal Diazki
Format: Article
Language:Indonesian
Published: University of Brawijaya 2024-07-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Subjects:
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/8144
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Perusahaan perlu menilai kinerja karyawan mereka untuk berbagai tujuan, termasuk promosi jabatan. Namun, data karyawan yang semakin rumit dapat membuat proses penilaian ini menjadi sulit. Penelitian ini bertujuan untuk membuat model machine learning yang dapat memprediksi apakah karyawan berpotensi untuk dipromosikan atau tidak. Penelitian ini menggunakan metode Machine Learning LifeCycle (MLLC) dan algoritma K-Nearest Neighbor. Untuk mengatasi masalah ketidakseimbangan label kelas dalam dataset, teknik SMOTE (Synthetic Minority Over-sampling Technique) digunakan. Hasil dari penelitian ini, model dibangun dengan melakukan pemisahan data menggunakan cross validation dan menggunakan nilai k=2 dalam implementasi algoritma K-Nearest Neighbor. Hasil evaluasi model menunjukkan kinerja yang sangat baik dengan nilai akurasi 94%, nilai presisi 90,8%, dan nilai recall 97,4%. Selain itu, evaluasi confusion matrix menunjukkan bahwa hanya 562 dari 9377 data testing yang tidak sesuai dengan hasil klasifikasi. Model ini juga memiliki kurva ROC yang baik yang hampir menyentuh sudut kiri atas dan nilai AUC sebesar 94,1% atau 0,94 yang termasuk ke dalam kategori excellent.
ISSN:2355-7699
2528-6579