การจำแนกประเภทแบบมัลติเลเบลสำหรับหัวเรื่องหนังสือทางบรรณารักษศาสตร์
收藏DataCite Commons2022-08-24 更新2025-04-16 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2021.478
下载链接
链接失效反馈官方服务:
资源简介:
งานวิจัยนี้ศึกษาวิธีการทำนายหัวเรื่องโดยใช้ชื่อเรื่องและสารบัญของหนังสือเพื่อลดเวลาในการวิเคราะห์และกำหนดหัวเรื่อง โดยข้อมูลหัวเรื่องหนังสือเป็นข้อมูลแบบมัลติเลเบล ซึ่งจากงานวิจัยในอดีตที่ศึกษาเกี่ยวกับการกำหนดหัวเรื่องหนังสือนั้นพบว่าการใช้เทคนิคแบบมัลติเลเบลทำให้ประสิทธิภาพของโมเดลต่ำ เนื่องจากข้อมูลหัวเรื่องนั้นมีจำนวนมากและทำให้ข้อมูลที่ใช้ในการฝึกน้อย จากปัญหาข้างต้นผู้วิจัยจึงประยุกต์ใช้การจำแนกแบบลำดับชั้น (Hierarchical Multi-Label Classification) ร่วมกับการจำแนกประเภทข้อความ (Text Classification) โดยแบ่งการทำนายหัวเรื่องออกเป็นที่ละลำดับชั้น โดยโมเดลการทำนายหัวเรื่องลำดับที่ 1 จะเปรียบเทียบ 3 เทคนิคได้แก่ K-Nearest Neighbors Logistic Regression, และ Random Forest ผลการทดลองพบว่า Logistic Regression มีประสิทธิภาพดีที่สุด โดยมี คะแนน F1 เท่ากับ 0.84 สำหรับโมเดลการทำนายหัวเรื่องลำดับที่ 2 จะเลือกใช้เทคนิคที่มีประสิทธิภาพดีที่สุดจากผลการทดลองของโมเดลการทำนายหัวเรื่องลำดับที่ 1 คือ Logistic Regression โดยโมเดลการทำนายหัวเรื่องลำดับที่ 2 มีคะแนน F1 เฉลี่ยเท่ากับ 0.83
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2022-08-24



