irds/neumarco_fa
收藏Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/neumarco_fa
下载链接
链接失效反馈官方服务:
资源简介:
`neumarco/fa`数据集由`ir-datasets`包提供,包含`docs`(文档,即语料库),文档数量为8,841,823。该数据集被多个相关数据集使用,如`neumarco_fa_dev`、`neumarco_fa_dev_judged`等。用户可以通过`datasets`库加载该数据集,并访问每个文档的`doc_id`和`text`字段。
提供机构:
irds
原始信息汇总
数据集概述
数据集名称
neumarco/fa
数据来源
由 ir-datasets 包提供。
数据内容
- 文档 (
docs): 包含8,841,823个文档,构成语料库。
数据用途
该数据集被用于以下项目:
neumarco_fa_devneumarco_fa_dev_judgedneumarco_fa_dev_smallneumarco_fa_trainneumarco_fa_train_judged
使用示例
python from datasets import load_dataset
docs = load_dataset(irds/neumarco_fa, docs) for record in docs: record # {doc_id: ..., text: ...}



