การจำแนกข้อความตามทฤษฎีการวิเคราะห์การสื่อสารสัมพันธ์ระหว่างบุคคลด้วยเทคนิคการเรียนรู้ของเครื่อง
收藏DataCite Commons2025-01-22 更新2025-04-16 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2024.52
下载链接
链接失效反馈官方服务:
资源简介:
งานวิจัยนี้มีวัตถุประสงค์เพื่อรวบรวมข้อมูลการสนทนาและให้ผู้ทรงคุณวุฒิประเมินข้อความตามกรอบแนวคิดทฤษฎีการวิเคราะห์การสื่อสารสัมพันธ์ระหว่างบุคคล เพื่อศึกษาและพัฒนาโมเดลการจำแนกข้อความตามทฤษฎีดังกล่าวด้วยเทคนิคการเรียนรู้ของเครื่อง และเพื่อศึกษาเทคนิคการเรียนรู้แบบกึ่งมีผู้สอน และประยุกต์ใช้ในการปรับสมดุลข้อมูล เพื่อเพิ่มประสิทธิภาพของโมเดล ในการดำเนินการวิจัย ทำการรวบรวมประโยคจากประวัติการสนทนาจำนวน 13,000 ประโยค ทำการคัดเลือกประประโยค 1,114 ประโยคเพื่อจำแนกแล้วให้ผู้ทรงคุณวุฒิทำการประเมินประโยคตามหลัก IOC นำประโยคที่ผ่านเกณฑ์จำนวน 1,108 ประโยค มาฝึกสอนโมเดลเพื่อสร้างชุดข้อมูลที่มีการกำกับด้วยเครื่อง โดยคัดเลือกประโยคที่โมเดลทำนายมีความมั่นใจตั้งแต่ 70% ขึ้นไป การสร้างโมเดลจะใช้ 3 เทคนิคคือ SVM, Naïve Bayes และ Decision Tree มีการใช้ชุดข้อมูล 3 แบบ โดยที่จะใช้ชุดทดสอบเดียวกัน ชุดฝึกสอนชุดที่ 1 ใช้ชุดข้อมูลที่กำกับป้ายด้วยคน และแบ่งชุดข้อมูลออกเป็น 2 ชุด คือชุดฝึกสอน 80% (886 ประโยค) ชุดทดสอบ 20% (222 ประโยค) ผลการวัดประสิทธิภาพพบว่า เทคนิค Naïve Bayes มีประสิทธิภาพสูงที่สุด 58% ชุดฝึกสอนชุดที่ 2 ใช้ชุดข้อมูลที่กำกับป้ายด้วยคนและชุดข้อมูลที่มีการกำกับด้วยเครื่องรวมจำนวน 2,947 ประโยค พบว่า เทคนิค Naïve Bayes มีประสิทธิภาพสูงที่สุด 70% ชุดฝึกสอนชุดที่ 3 ใช้ชุดข้อมูลที่กำกับป้ายด้วยคนและชุดข้อมูลที่มีการกำกับด้วยเครื่องรวมกับเทคนิคการปรับสมดุลของข้อมูล เพิ่มป้ายกำกับด้วยเครื่องเฉพาะคลาส P และ A พบว่า SVM มีประสิทธิภาพสูงที่สุด 59% ผลการวัดประสิทธิภาพของโมเดลภายหลังการเพิ่มข้อมูลด้วยเทคนิคการเรียนรู้แบบกึ่งมีผู้สอนและเทคนิคการปรับสมดุลของข้อมูลแล้ว พบว่า โมเดลที่ได้จากสามเทคนิคการเรียนรู้ของเครื่องให้ผลการทำนายที่มีค่าความถูกต้อง ค่าความแม่นยำ ค่าความระลึกและค่า F1-Score สูงขึ้นเล็กน้อยเมื่อเทียบกับชุดข้อมูลส่วนที่มีป้ายกำกับด้วยคน จากผลการวัดประสิทธิภาพของโมเดล ชี้ให้เห็นว่า เทคนิค SVM มีประสิทธิภาพมากที่สุดเมื่อพิจารณาจากค่าความถูกต้อง ค่าความแม่นยำ ค่าความระลึกและค่า F1-Score ซึ่งมีค่าสูงถึงโดยเฉลี่ย 59% ส่วนเทคนิค Naïve Bayes มีค่าความถูกต้อง ค่าความแม่นยำ ค่าความระลึกและค่า F1-Score โดยเฉลี่ยเพียง 50% ซึ่งน้อยที่สุด จะเห็นได้ว่า เทคนิค SVM ให้ผลการทำนายที่มีประสิทธิภาพสูงกว่า เมื่อเทียบกับเทคนิค Naïve Bayes และ Decision Tree เทคนิค Naïve Bayes มีค่าต่ำที่สุด เนื่องจากเทคนิคนี้จับความสัมพันธ์ระหว่างคุณลักษณะได้ไม่ดีเท่าเทคนิคอื่น ๆ อย่างไรก็ตาม การปรับสมดุลข้อมูลด้วยเทคนิคการเรียนรู้แบบกึ่งมีผู้สอนและการปรับสมดุลของข้องมูลเฉพาะคลาส P และคลาส A ทำให้ประสิทธิภาพของโมลดลง แต่เมื่อพิจารณาจาก Confusion Matrix จะพบว่าคลาส P และคลาส A ทำนายได้ถูกต้องมากขึ้นส่วนคลาส C นั้นทำนายได้ถูกต้องลดลงกว่า 30%
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2025-01-22



