DFND : Dravidian_Fake News Data
收藏ieee-dataport.org2025-01-22 收录
下载链接:
https://ieee-dataport.org/documents/dfnd-dravidianfake-news-data
下载链接
链接失效反馈官方服务:
资源简介:
DFND is a Dravidian fake news dataset for detecting fake news in Dravidian languages, namely Telugu, Kannada, Tamil, and Malayalam. We collected the data from different sources: for real news articles, we scrapped the data from various news websites like Eenadu, Dinamalar, Kannadaprabha, Malayala manorama, etc.; for fake news articles, we scrapped the data from various fact-checking websites like factly, factcrescendo, etc. We collected the data from January 2021 to December 2022. After collecting the data, data preprocessing was performed through our designed script; the data annotation on preprocessed data was performed through corresponding language experts to mentioned Dravidian languages. The DFND dataset is preprocessed. This dataset contains more than 27,000 news articles which consist of 50% fake and 50% real news articles.
DFND,即德拉维达语系虚假新闻数据集,旨在检测泰卢固语、卡纳达语、泰米尔语和马拉雅拉姆语等德拉维达语系中的虚假新闻。本数据集的收集工作涉及多方来源:对于真实新闻文章,我们通过抓取如Eenadu、Dinamalar、Kannadaprabha、Malayala manorama等众多新闻网站的数据;对于虚假新闻文章,我们则从factly、factcrescendo等众多事实核查网站中获取数据。数据收集时间跨度为2021年1月至2022年12月。数据收集完成后,我们通过自设计的脚本对数据进行预处理;对预处理后的数据进行了标注,标注工作由相应语言的专家负责。DFND数据集已进行预处理。该数据集包含超过27,000篇新闻文章,其中虚假新闻和真实新闻各占50%。
提供机构:
IEEE Dataport
搜集汇总
数据集介绍

背景与挑战
背景概述
DFND是一个德拉维达语系假新闻检测数据集,涵盖泰卢固语、卡纳达语、泰米尔语和马拉雅拉姆语四种语言,包含超过27,000篇新闻文章,其中假新闻和真实新闻各占50%。数据来源于2021年至2022年的新闻网站和事实核查平台,并经过预处理和语言专家标注,适用于多语言假新闻识别研究。
以上内容由遇见数据集搜集并总结生成



