asas-ai/AraFacts
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/asas-ai/AraFacts
下载链接
链接失效反馈官方服务:
资源简介:
AraFacts是第一个大型阿拉伯语自然发生声明数据集,包含4672个训练样本,用于声明验证任务。数据集包括声明ID、声明内容、描述、来源、日期、来源标签、标准化标签、来源类别、标准化类别、来源URL、声明URL、证据URL和声明类型等特征。数据集大小为7881243字节,下载大小为4020264字节,许可证为cc-by-nc-4.0,适用于文本分类任务,语言为阿拉伯语。
AraFacts是第一个大型阿拉伯语自然发生声明数据集,包含4672个训练样本,用于声明验证任务。数据集包括声明ID、声明内容、描述、来源、日期、来源标签、标准化标签、来源类别、标准化类别、来源URL、声明URL、证据URL和声明类型等特征。数据集大小为7881243字节,下载大小为4020264字节,许可证为cc-by-nc-4.0,适用于文本分类任务,语言为阿拉伯语。
提供机构:
asas-ai
原始信息汇总
数据集概述
数据集名称
AraFacts: The First Large Arabic Dataset of Naturally Occurring Claims
数据集特征
- ClaimID: 字符串
- claim: 字符串
- description: 字符串
- source: 字符串
- date: 字符串
- source_label: 字符串
- normalized_label: 字符串
- source_category: 字符串
- normalized_category: 字符串
- source_url: 字符串
- claim_urls: 字符串
- evidence_urls: 字符串
- claim_type: 整数(64位)
数据集划分
- train: 4672个样本,大小为7881243字节
数据集大小
- 下载大小: 4020264字节
- 数据集大小: 7881243字节
许可
cc-by-nc-4.0
任务类别
- 文本分类
语言
- 阿拉伯语
数据集标签
- Claim Verification



