การพัฒนาโมเดลการเรียนรู้ของเครื่องในการจำแนกประเภทการลาออกของพนักงาน

Name: การพัฒนาโมเดลการเรียนรู้ของเครื่องในการจำแนกประเภทการลาออกของพนักงาน
Creator: มหาวิทยาลัยธรรมศาสตร์
Published: 2025-08-15 13:50:32
License: 暂无描述

DataCite Commons2025-08-15 更新2026-05-04 收录

下载链接：

http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2024.387

下载链接

链接失效反馈

官方服务：

资源简介：

งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของโมเดลการเรียนรู้ของเครื่องในการจำแนกการลาออกของพนักงาน และพัฒนาโมเดลให้มีประสิทธิภาพสูงขึ้น โดยใช้ชุดข้อมูลจาก Kaggle สองชุด ได้แก่ Employee Attrition and Factors ซึ่งเป็นข้อมูลพนักงานจาก IBM จำนวน 1,470 รายการ และ Watson Healthcare จากบริษัท NSI Nursing Solutions จำนวน 1,676 รายการ งานวิจัยได้แบ่งโมเดลออกเป็นสองกลุ่มหลัก คือ กลุ่มโมเดลแบบดั้งเดิม (Logistic Regression, Decision Tree, XGBoost, Support Vector Machine และ K-Nearest Neighbors) และกลุ่มโมเดลประเภทโครงข่ายประสาทเทียม (Multilayer Perceptron, Convolutional Neural Network และ Recurrent Neural Network) ในการประมวลผลข้อมูลมีการทำ Label Encoding, Standard Scaling และ One-Hot Encoding เพื่อจัดเตรียมข้อมูลให้เหมาะสมและกำจัดปัญหาข้อมูลไม่สมดุลด้วยเทคนิค Oversampling (SMOTE) โดยแบ่งข้อมูลฝึกสอนและทดสอบที่อัตราส่วน 80:20 และใช้เทคนิค Grid Search ร่วมกับ Cross Validation ในการเพิ่มประสิทธิภาพของโมเดล ผลการทดลองแสดงให้เห็นว่าโมเดล Decision Tree และ XGBoost มีประสิทธิภาพดีที่สุดในการจำแนกข้อมูล Employee Attrition and Factors โดยมีค่า Precision และ Recall สูงสุดที่ (0.53 และ 0.31) เนื่องจากสามารถจัดการข้อมูลที่ซับซ้อนและมีการปรับแต่งพารามิเตอร์ได้ดี ส่วนโมเดลที่ไม่มีประสิทธิภาพ ได้แก่ K-Nearest Neighbors, Convolutional Neural Network และ Recurrent Neural Network เนื่องจากข้อจำกัดในการประมวลผลข้อมูลเชิงตาราง สำหรับชุดข้อมูล Watson Healthcare พบว่าโมเดล XGBoost ให้ผลลัพธ์ดีที่สุดก่อนการปรับแต่ง (Precision 0.74, Recall 0.65) ขณะที่ Decision Tree, Multilayer Perceptron และ Recurrent Neural Network มีประสิทธิภาพเพิ่มขึ้นอย่างชัดเจนหลังจากการปรับแต่ง โดยมีค่า Precision และ Recall อยู่ในระดับสูง (ประมาณ 0.63-0.67) จากการทดสอบข้ามชุดข้อมูล (Cross Testing) พบว่าโมเดลที่ฝึกด้วยข้อมูล Watson Healthcare และทดสอบด้วยชุด Employee Attrition and Factors มีประสิทธิภาพสูงกว่า โดยเฉพาะโมเดล Support Vector Machine ที่สามารถ generalize ได้ดีที่สุด ข้อเสนอแนะจากงานวิจัยนี้คือ ควรนำชุดข้อมูลที่เป็นการเก็บข้อมูลจริงจากองค์กรมาใช้ในการฝึกโมเดล เพื่อปรับปรุงความแม่นยำในการทำนายและเพิ่มความสามารถในการใช้งานจริงในการจำแนกการลาออกของพนักงานในองค์กรต่าง ๆ ต่อไป

提供机构：

มหาวิทยาลัยธรรมศาสตร์

创建时间：

2025-08-15