การจำแนกอาชีพจากภาพถ่ายเครื่องแบบโดยใช้เทคนิคการเรียนรู้เชิงลึก
收藏DataCite Commons2023-09-19 更新2025-04-16 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2022.575
下载链接
链接失效反馈官方服务:
资源简介:
การจำแนกอาชีพจากภาพถ่ายของเครื่องแบบในประเทศไทยนั้นมีความท้าทาย เนื่องจากความคล้ายคลึงกันในเครื่องแบบของหลายอาชีพ หรือที่เรียกว่า ความคล้ายคลึงกันระหว่างคลาส (Inter-class similarity) และความหลากหลายของเครื่องแบบภายในอาชีพเดียวกัน หรือที่เรียกว่า ความต่างภายในคลาสเดียวกัน (Intra-class variance) โมเดลที่มีอยู่ในปัจจุบันเช่น ResNet50 มีแนวโน้มที่จะเลือกรู้จำเครื่องแบบจากสีมากกว่าลักษณะอื่นๆ งานวิจัยนี้นำเสนอเทคนิค Grayscale feature extractor (GFE) ซึ่งสามารถนำไปใช้เพิ่มประสิทธิภาพโมเดลจำแนกภาพเดิมให้เรียนรู้คุณลักษณะอื่นๆ นอกจากสีของภาพให้มากขึ้น ช่วยแก้ปัญหา Inter-class similarity และ Intra-class variance และเพิ่มความแม่นยำให้กับโมเดล งานวิจัยนี้นำเสนอชุดข้อมูลรูปภาพอาชีพในประเทศไทย ได้แก่ ข้าราชการพลเรือน ทหาร ตำรวจ พระ มอเตอร์ไซค์รับจ้าง นักเรียน หมอ พยาบาล พนักงานรักษาความปลอดภัย และอื่นๆ รวมทั้งหมด 40,070 รูป โดยการทดลองได้แบ่งออกเป็น 2 ส่วน คือ การทดลองร่วมกับชุดข้อมูล 10,000 รูป ที่มีจำนวนรูปเท่ากันในแต่ละคลาส และการทดลองร่วมกับชุดข้อมูล 40,070 รูป ที่มีจำนวนรูปไม่เท่ากันในแต่ละคลาส ซึ่งทั้งสองการทดลองจะทำร่วมกับโมเดล MobileNet ResNet50 ResNet101 และ InceptionV3 จากผลการทดลองพบว่า GFE สามารถลดผลกระทบการจำแนกอาชีพจากภาพที่มีปัญหา Inter-class similarity และ Intra-class variance ลงได้ และสามารถเพิ่มค่าความแม่นยำในการจำแนกชุดข้อมูล 10,000 รูปจากโมเดลดั้งเดิมที่ไม่ได้ใช้ GFE ได้ประมาณ 3 ถึง 10 เปอร์เซ็นต์ แต่ในชุดข้อมูล 40,070 รูปนั้น GFE ไม่สามารถเพิ่มค่าความแม่นยำได้มากนัก
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2023-09-19



