community-datasets/fake_news_english
收藏数据集卡片:Fake News English
数据集描述
- 数据集摘要:该数据集包含被分类为假新闻或讽刺新闻的文章URL。被分类为假新闻的文章还包含一个反驳文章的URL。
- 支持的任务和排行榜:[更多信息需补充]
- 语言:英语
数据集结构
数据实例
json { "article_number": 102, "url_of_article": "https://newslo.com/roger-stone-blames-obama-possibility-trump-alzheimers-attacks-president-caused-severe-stress/", "fake_or_satire": 1, # Fake "url_of_rebutting_article": "https://www.snopes.com/fact-check/donald-trumps-intelligence-quotient/" }
数据字段
article_number:用于每行索引的整数url_of_article:包含待评估和分类为假新闻或讽刺新闻的文章URL的字符串fake_or_satire:上述变量的类别标签,可以是假新闻(1)或讽刺新闻(0)url_of_rebutting_article:包含用于反驳问题文章(在url_of_article中)的文章URL的字符串
数据分割
该数据集未分割,仅提供训练集。
数据集创建
策划理由
[更多信息需补充]
源数据
初始数据收集和规范化
[更多信息需补充]
源语言生产者
[更多信息需补充]
注释
注释过程
[更多信息需补充]
注释者
[更多信息需补充]
个人和敏感信息
[更多信息需补充]
使用数据的注意事项
数据集的社会影响
[更多信息需补充]
偏见的讨论
[更多信息需补充]
其他已知限制
[更多信息需补充]
附加信息
数据集策展人
- Golbeck, Jennifer
- Everett, Jennine
- Falak, Waleed
- Gieringer, Carl
- Graney, Jack
- Hoffman, Kelly
- Huth, Lindsay
- Ma, Zhenya
- Jha, Mayanka
- Khan, Misbah
- Kori, Varsha
- Mauriello, Matthew
- Lewis, Elo
- Mirano, George
- IV, William
- Mussenden, Sean
- Nelson, Tammie
- Mcwillie, Sean
- Pant, Akshat
- Cheakalos, Paul
许可信息
[更多信息需补充]
引用信息
bibtex @inproceedings{inproceedings, author = {Golbeck, Jennifer and Everett, Jennine and Falak, Waleed and Gieringer, Carl and Graney, Jack and Hoffman, Kelly and Huth, Lindsay and Ma, Zhenya and Jha, Mayanka and Khan, Misbah and Kori, Varsha and Mauriello, Matthew and Lewis, Elo and Mirano, George and IV, William and Mussenden, Sean and Nelson, Tammie and Mcwillie, Sean and Pant, Akshat and Cheakalos, Paul}, year = {2018}, month = {05}, pages = {17-21}, title = {Fake News vs Satire: A Dataset and Analysis}, doi = {10.1145/3201064.3201100} }
贡献
感谢 @MisbahKhan789 和 @lhoestq 添加此数据集。



