nikchar/retrieval_verification_distilbert
收藏Hugging Face2023-09-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nikchar/retrieval_verification_distilbert
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于检索验证任务,包含多个特征如claim、证据链接、文本内容、检索到的证据标题和文本、标签、检索成功标志以及预测标签。数据集主要分为训练集,用于模型训练和验证。
该数据集用于检索验证任务,包含多个特征如claim、证据链接、文本内容、检索到的证据标题和文本、标签、检索成功标志以及预测标签。数据集主要分为训练集,用于模型训练和验证。
提供机构:
nikchar
原始信息汇总
数据集概述
数据集信息
特征
- claim: 数据类型为字符串。
- evidence_wiki_url: 数据类型为字符串。
- text: 数据类型为字符串。
- retrieved_evidence_title: 数据类型为字符串序列。
- retrieved_evidence_text: 数据类型为字符串序列。
- labels: 数据类型为64位整数。
- Retrieval_Success: 数据类型为布尔值。
- Predicted_Labels: 数据类型为64位整数。
- Predicted_Labels_Each_doc: 数据类型为64位整数序列。
数据分割
- train: 包含11073个样本,总字节数为73601741。
数据大小
- 下载大小: 34426496字节。
- 数据集大小: 73601741字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



