การจำแนกข้อความที่มีการคาดการณ์อนาคตในรายงานประจำปี 56-1 one report ของกลุ่มบริษัท SET100 โดยใช้เทคนิคการเรียนรู้ของเครื่อง
收藏DataCite Commons2025-09-11 更新2026-05-04 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2024.734
下载链接
链接失效反馈官方服务:
资源简介:
งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อพัฒนาโมเดลภาษาไทยที่สามารถจำแนกประเภทข้อความที่มีการคาดการณ์อนาคต (Forward-Looking Statements: FLS) ในรายงาน 56-1 One Report ของบริษัทกลุ่ม SET100 โดยจำแนกเป็น 3 ประเภท ได้แก่ 1) Not-FLS 2) Non-Specific FLS และ 3) Specific-FLS ผ่านเทคนิคการจำแนกข้อความแบบหลายป้ายกำกับ ด้วยการฝึกโมเดล WangchanBERTa โดยใช้ข้อมูลจำนวน 1,780 กลุ่มข้อความจากรายงานประจำปี 56-1 One Report พ.ศ. 2564 จากกลุ่มบริษัท SET100 เป็นชุดข้อมูลในการฝึกโมเดล ผลลัพธ์จากงานวิจัยนี้แสดงให้เห็นว่า โมเดลสามารถจำแนกข้อความประเภท Not-FLS ได้แม่นยำสูงสุด (F1-score = 0.98) ขณะที่ข้อความประเภท Non-Specific และ Specific-FLS มี F1-score อยู่ในระดับดี (F1-score = 0.76 และ 0.75 ตามลำดับ) แต่ยังมีข้อจำกัดในความไม่สมดุลของชุดข้อมูลที่นำมาฝึกโมเดล และโมเดลมีอาการ Overfitting หรืออาจไม่สามารถทำความเข้าใจเนื้อหาในข้อมูลชุดใหม่ได้อย่างแท้จริง และอาจทำนายข้อความได้ไม่แม่นยำเท่าที่ควร ทั้งนี้สามารถนำผลการศึกษาและโมเดลจากงานวิจัยนี้ไปใช้ต่อยอดได้ เพื่อทดลองทำนายข้อความในระดับเบื้องต้น หรือฝึกโมเดลเพิ่มเติมเพื่อเพิ่มประสิทธิภาพของโมเดลให้ดียิ่งขึ้น
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2025-09-11



