การปรับปรุงประสิทธิภาพการเรียนรู้ของเครื่องจักรในข้อมูลเรซูเม่ที่ไม่สมดุลโดยใช้ SMOTE สำหรับการจำแนกประเภทผู้สมัครงาน

ปัญหาความไม่สมดุลของข้อมูลในกระบวนการเรียนรู้ของเครื่องเป็นข้อจำกัดสำคัญที่ส่งผลต่อประสิทธิภาพของโมเดล โดยเฉพาะในกรณีที่กลุ่มข้อมูลกลุ่มน้อยมีจำนวนน้อยกว่ากลุ่มข้อมูลกลุ่มใหญ่ ทำให้โมเดลเรียนรู้มีความลำเอียงและจำแนกข้อมูลได้ไม่แม่นยำ วิธีการแก้ไขปัญหานี้ในปัจจุบันที่ได้รับความนิยมคือการเพิ่มข้อมูลต...

Full description

Saved in:
Bibliographic Details
Main Authors: วริสรา วสุอารยะศักดิ์, ณัฐดนัย มังคลัง, จิรภัทร สมเสียง, ชัยศิริ สนิทพลกลาง
Format: Article
Language:English
Published: Surindra Rajabhat University, Faculty of Science and Technology, Department of Computer Education 2025-04-01
Series:Journal of Computer and Creative Technology
Subjects:
Online Access:https://so13.tci-thaijo.org/index.php/jcct/article/view/1557
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:ปัญหาความไม่สมดุลของข้อมูลในกระบวนการเรียนรู้ของเครื่องเป็นข้อจำกัดสำคัญที่ส่งผลต่อประสิทธิภาพของโมเดล โดยเฉพาะในกรณีที่กลุ่มข้อมูลกลุ่มน้อยมีจำนวนน้อยกว่ากลุ่มข้อมูลกลุ่มใหญ่ ทำให้โมเดลเรียนรู้มีความลำเอียงและจำแนกข้อมูลได้ไม่แม่นยำ วิธีการแก้ไขปัญหานี้ในปัจจุบันที่ได้รับความนิยมคือการเพิ่มข้อมูลตัวอย่างด้วยวิธี SMOTE ซึ่งสร้างตัวอย่างข้อมูลใหม่ในกลุ่มชนกลุ่มน้อยโดยอาศัยการคำนวณระยะห่างระหว่างข้อมูลที่มีอยู่ งานวิจัยนี้นำเสนอการประยุกต์ใช้ SMOTE ในการปรับปรุงประสิทธิภาพการเรียนรู้ของเครื่องด้วยโมเดล Decision Tree, Random Forest, และ K-NN จากชุดข้อมูลที่ไม่สมดุล พบว่าค่าความถูกต้องของโมเดลเพิ่มขึ้นจาก 0.83, 0.86, และ 0.80 เป็น 0.84, 0.88, และ 0.82 ตามลำดับโดยมีนัยสำคัญทางสถิติหลังจากใช้ SMOTE ซึ่งแสดงให้เห็นถึงประสิทธิภาพของวิธีการดังกล่าวในการแก้ไขปัญหาความไม่สมดุลของข้อมูล ผลการวิจัยยืนยันว่า SMOTE ช่วยปรับปรุงความสามารถในการจำแนกข้อมูลชนกลุ่มน้อยทำให้โมเดลมีความแม่นยำและเหมาะสมต่อการใช้งานในบริบทที่ข้อมูลมีความไม่สมดุล โดยเข้ามาช่วยลดเวลาในการคัดเลือกบุคคลของฝ่ายสรรหาบุคลากรได้อีกด้วย
ISSN:2985-1580
2985-1599