five

factckbr/factckbr

收藏
Hugging Face2024-01-18 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/factckbr/factckbr
下载链接
链接失效反馈
官方服务:
资源简介:
FACTCK BR数据集用于研究葡萄牙语的假新闻,包含1309条声明及其对应的标签。数据来源于ClaimReview,这是一个由事实核查机构使用的结构化数据模式,用于在搜索引擎中分享他们的结果,从而实现实时数据收集。数据集的特征包括URL、作者、日期、声明、评论、标题、评分、最佳评分和标签。标签有多个类别,如falso(假)、distorcido(扭曲)、impreciso(不准确)等。数据集分为训练集,包含1313个样本,大小为750646字节。
提供机构:
factckbr
原始信息汇总

数据集描述

数据集概述

FACTCK BR 数据集用于研究葡萄牙语中的假新闻,提供被认为是虚假的新闻及其相应的事实核查和分类。数据来源于 ClaimReview,这是一个由事实核查机构使用的结构化数据模式,用于在搜索引擎中分享其结果,从而实现实时数据收集。FACTCK.BR 数据集包含 1309 条声明及其相应的标签。

支持的任务和排行榜

[更多信息需补充]

语言

[更多信息需补充]

数据集结构

数据实例

[更多信息需补充]

数据字段

  • url: 字符串类型
  • author: 字符串类型
  • date: 字符串类型
  • claim: 字符串类型
  • review: 字符串类型
  • title: 字符串类型
  • rating: float32 类型
  • best_rating: float32 类型
  • label: 分类标签,包含以下类别:
    • 0: falso
    • 1: distorcido
    • 2: impreciso
    • 3: exagerado
    • 4: insustentável
    • 5: verdadeiro
    • 6: outros
    • 7: subestimado
    • 8: impossível provar
    • 9: discutível
    • 10: sem contexto
    • 11: de olho
    • 12: verdadeiro, mas
    • 13: ainda é cedo para dizer

数据分割

  • train: 包含 1313 个实例,750646 字节

数据集创建

策划理由

[更多信息需补充]

源数据

初始数据收集和规范化

[更多信息需补充]

源语言生产者

[更多信息需补充]

注释

注释过程

[更多信息需补充]

注释者

[更多信息需补充]

个人和敏感信息

[更多信息需补充]

使用数据的注意事项

数据集的社会影响

[更多信息需补充]

偏见的讨论

[更多信息需补充]

其他已知限制

[更多信息需补充]

附加信息

数据集策展人

[更多信息需补充]

许可信息

[更多信息需补充]

引用信息

[更多信息需补充]

贡献

感谢 @hugoabonizio 添加此数据集。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作