PaDaS-Lab/corect-climate-fever
收藏Hugging Face2026-04-15 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/PaDaS-Lab/corect-climate-fever
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
task_categories:
- text-retrieval
task_ids:
- document-retrieval
config_names:
- corpus
tags:
- text-retrieval
dataset_info:
- config_name: qrels
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: int64
- name: type
dtype: string
splits:
- name: default
num_bytes: 317729
num_examples: 4681
- config_name: queries
features:
- name: _id
dtype: string
- name: text
dtype: string
splits:
- name: test
num_bytes: 233473
num_examples: 1535
- config_name: corpus
features:
- name: _id
dtype: string
- name: title
dtype: string
- name: headings
dtype: string
- name: text
dtype: string
splits:
- name: pass_core
num_bytes: 2431985
num_examples: 1344
- name: pass_10k
num_bytes: 6574261
num_examples: 10000
- name: pass_100k
num_bytes: 50930296
num_examples: 100000
- name: pass_1M
num_bytes: 589222456
num_examples: 1000000
- name: pass_10M
num_bytes: 3317258017
num_examples: 5416593
configs:
- config_name: qrels
data_files:
- split: default
path: qrels.jsonl
- config_name: queries
data_files:
- split: test
path: queries.jsonl
- config_name: corpus
data_files:
- split: pass_core
path: corpus_core.jsonl
- split: pass_10k
path: corpus_10000.jsonl
- split: pass_100k
path: corpus_100000.jsonl
- split: pass_1M
path: corpus_1000000.jsonl
- split: pass_10M
path: corpus_10000000.jsonl
---
语言:
- 英语
任务类别:
- 文本检索(text-retrieval)
任务子类别:
- 文档检索(document-retrieval)
配置名称:
- corpus(语料库)
标签:
- 文本检索(text-retrieval)
数据集信息:
- 配置名称:查询相关性标注(qrels)
特征:
- 字段名:query-id(查询ID),数据类型:字符串(string)
- 字段名:corpus-id(语料库ID),数据类型:字符串(string)
- 字段名:score(评分),数据类型:64位整数(int64)
- 字段名:type(类型),数据类型:字符串(string)
划分集:
- 划分名称:default(默认),字节数:317729,样本数量:4681
- 配置名称:queries(查询集)
特征:
- 字段名:_id,数据类型:字符串(string)
- 字段名:text(文本),数据类型:字符串(string)
划分集:
- 划分名称:test(测试集),字节数:233473,样本数量:1535
- 配置名称:corpus(语料库)
特征:
- 字段名:_id,数据类型:字符串(string)
- 字段名:title(标题),数据类型:字符串(string)
- 字段名:headings(小节标题),数据类型:字符串(string)
- 字段名:text(文本),数据类型:字符串(string)
划分集:
- 划分名称:pass_core(核心段落集),字节数:2431985,样本数量:1344
- 划分名称:pass_10k(1万段落集),字节数:6574261,样本数量:10000
- 划分名称:pass_100k(10万段落集),字节数:50930296,样本数量:100000
- 划分名称:pass_1M(100万段落集),字节数:589222456,样本数量:1000000
- 划分名称:pass_10M(1000万段落集),字节数:3317258017,样本数量:5416593
配置项:
- 配置名称:查询相关性标注(qrels)
数据文件:
- 划分:default(默认),路径:qrels.jsonl
- 配置名称:queries(查询集)
数据文件:
- 划分:test(测试集),路径:queries.jsonl
- 配置名称:corpus(语料库)
数据文件:
- 划分:pass_core(核心段落集),路径:corpus_core.jsonl
- 划分:pass_10k(1万段落集),路径:corpus_10000.jsonl
- 划分:pass_100k(10万段落集),路径:corpus_100000.jsonl
- 划分:pass_1M(100万段落集),路径:corpus_1000000.jsonl
- 划分:pass_10M(1000万段落集),路径:corpus_10000000.jsonl
提供机构:
PaDaS-Lab



