five

sayalaruano/FakeNewsCorpusSpanish

收藏
Hugging Face2022-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sayalaruano/FakeNewsCorpusSpanish
下载链接
链接失效反馈
官方服务:
资源简介:
西班牙语假新闻语料库包含两个版本:Version 1.0和Version 2.0。Version 2.0包含572个实例,涵盖了科学、体育、政治、社会、COVID-19、环境和国际等主题,数据收集时间为2020年11月至2021年3月。Version 1.0包含971个新闻,分为491个真实新闻和480个假新闻,数据收集时间为2018年1月至7月。两个版本的数据都来自报纸、媒体公司和事实核查网站,并且都标注了真实或假新闻的类别。语料库的列包括ID、类别、主题、来源、标题、文本和链接。
提供机构:
sayalaruano
原始信息汇总

数据集概述

西班牙假新闻语料库版本2.0

语料库描述

  • 收集时间:2020年11月至2021年3月
  • 内容:包含572对假新闻和真实新闻的配对,涉及不同事件,全部为西班牙语编写。
  • 来源:主要来自新闻报纸和媒体公司网站,以及事实核查网站。
  • 分类:科学、体育、政治、社会、COVID-19、环境、国际。
  • 数据结构
    • Id:实例标识符
    • Category:新闻类别(真或假)
    • Topic:相关新闻主题
    • Source:来源名称
    • Headline:新闻标题
    • Text:新闻文本
    • Link:来源URL

引用指南

  • Gómez-Adorno, H., Posadas-Durán, J. P., Enguix, G. B., & Capetillo, C. P. (2021). Overview of FakeDeS at IberLEF 2021: Fake News Detection in Spanish Shared Task. Procesamiento del Lenguaje Natural, 67, 223-231.
  • Aragón, M. E., Jarquín, H., Gómez, M. M. Y., Escalante, H. J., Villaseñor-Pineda, L., Gómez-Adorno, H., ... & Posadas-Durán, J. P. (2020, September). Overview of mex-a3t at iberlef 2020: Fake news and aggressiveness analysis in mexican spanish. In Notebook Papers of 2nd SEPLN Workshop on Iberian Languages Evaluation Forum (IberLEF), Malaga, Spain.
  • Posadas-Durán, J. P., Gómez-Adorno, H., Sidorov, G., & Escobar, J. J. M. (2019). Detection of fake news in a new corpus for the Spanish language. Journal of Intelligent & Fuzzy Systems, 36(5), 4869-4876.

西班牙假新闻语料库版本1.0

语料库描述

  • 收集时间:2018年1月至2018年7月
  • 内容:包含971条新闻,其中491条为真实新闻,480条为假新闻。
  • 分类:科学、体育、经济、教育、娱乐、政治、健康、安全、社会。
  • 数据结构:与版本2.0相同。

引用指南

  • 同版本2.0的引用指南。

使用场景

  • 版本2.0用于Fake News Detection in Spanish (FakeDeS)共享任务,版本1.0用于Fake News Detection TaskMEX-A3T竞赛中。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作