factckbr/factckbr
收藏Hugging Face2024-01-18 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/factckbr/factckbr
下载链接
链接失效反馈官方服务:
资源简介:
FACTCK BR数据集用于研究葡萄牙语的假新闻,包含1309条声明及其对应的标签。数据来源于ClaimReview,这是一个由事实核查机构使用的结构化数据模式,用于在搜索引擎中分享他们的结果,从而实现实时数据收集。数据集的特征包括URL、作者、日期、声明、评论、标题、评分、最佳评分和标签。标签有多个类别,如falso(假)、distorcido(扭曲)、impreciso(不准确)等。数据集分为训练集,包含1313个样本,大小为750646字节。
提供机构:
factckbr
原始信息汇总
数据集描述
数据集概述
FACTCK BR 数据集用于研究葡萄牙语中的假新闻,提供被认为是虚假的新闻及其相应的事实核查和分类。数据来源于 ClaimReview,这是一个由事实核查机构使用的结构化数据模式,用于在搜索引擎中分享其结果,从而实现实时数据收集。FACTCK.BR 数据集包含 1309 条声明及其相应的标签。
支持的任务和排行榜
[更多信息需补充]
语言
[更多信息需补充]
数据集结构
数据实例
[更多信息需补充]
数据字段
- url: 字符串类型
- author: 字符串类型
- date: 字符串类型
- claim: 字符串类型
- review: 字符串类型
- title: 字符串类型
- rating: float32 类型
- best_rating: float32 类型
- label: 分类标签,包含以下类别:
- 0: falso
- 1: distorcido
- 2: impreciso
- 3: exagerado
- 4: insustentável
- 5: verdadeiro
- 6: outros
- 7: subestimado
- 8: impossível provar
- 9: discutível
- 10: sem contexto
- 11: de olho
- 12: verdadeiro, mas
- 13: ainda é cedo para dizer
数据分割
- train: 包含 1313 个实例,750646 字节
数据集创建
策划理由
[更多信息需补充]
源数据
初始数据收集和规范化
[更多信息需补充]
源语言生产者
[更多信息需补充]
注释
注释过程
[更多信息需补充]
注释者
[更多信息需补充]
个人和敏感信息
[更多信息需补充]
使用数据的注意事项
数据集的社会影响
[更多信息需补充]
偏见的讨论
[更多信息需补充]
其他已知限制
[更多信息需补充]
附加信息
数据集策展人
[更多信息需补充]
许可信息
[更多信息需补充]
引用信息
[更多信息需补充]
贡献
感谢 @hugoabonizio 添加此数据集。



