การตรวจจับข่าวปลอมภาษาไทยโดยใช้แบบจำลองการเรียนรู้ของเครื่อง
收藏DataCite Commons2023-08-16 更新2025-04-16 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2022.514
下载链接
链接失效反馈官方服务:
资源简介:
ข่าวปลอมจัดเป็นปัญหาสำคัญหนึ่งของสังคม การตรวจจับข่าวปลอมจึงเป็นขั้นตอนสำคัญในการยับยั้งและควบคุมดูแลไม่ให้มีการแพร่กระจายในวงกว้าง วิทยานิพนธ์นี้นำเสนอการตรวจจับข่าวปลอมภาษาไทยด้วยกระบวนการเรียนรู้ของเครื่องสามแบบจำลองได้แก่ Naïve Bayes, Neural Network และ Support Vector Machine โดยเก็บข้อมูลข่าวภาษาไทยจากเว็บไซต์ศูนย์ต่อต้านข่าวปลอม (ประเทศไทย) ในช่วงเดือนกันยายน 2561 ถึงเดือนกันยายน 2565 ข้อมูลข่าวผ่านกระบวนการเลือกคุณลักษณะ การแปลงค่าคุณลักษณะ การแบ่งค่าข้อมูลเป็นช่วง และการปรับช่วงของค่าข้อมูลให้อยู่ในช่วงเดียวกัน นอกจากนี้ยังผ่านกระบวนการสุ่มเกินเพื่อทำให้ข้อมูลข่าวมีจำนวนข่าวจริงและข่าวปลอมเท่ากัน งานวิจัยเปรียบเทียบประสิทธิภาพของแบบจำลองด้วยค่าร้อยละของความถูกต้อง ผลการวิจัยพบว่า แบบจำลอง Support Vector Machine มีค่าความถูกต้องร้อยละ 94 มากกว่าค่าความถูกต้องของแบบจำลอง Naïve Bayes และ Neural Network นอกจากนี้ยังพบว่าคุณลักษณะรายการคำที่ระบุในข้อความส่งผลให้ความถูกต้องของแบบจำลองเพิ่มขึ้น
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2023-08-16



