CoIR-Retrieval/cosqa-queries-corpus
收藏Hugging Face2024-09-12 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/CoIR-Retrieval/cosqa-queries-corpus
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含代码相关文本的数据集,适用于代码检索或代码理解任务。数据集分为queries和corpus两部分,每部分包含20604个示例。数据集字段包括_id,partition,text,title,language以及包含dummy_field的meta_information。
This is a dataset containing code-related texts, suitable for code search or code understanding tasks. The dataset is split into two parts, queries and corpus, each containing 20604 examples. The dataset fields include _id, partition, text, title, language, and meta_information which contains a dummy_field.
提供机构:
CoIR-Retrieval
原始信息汇总
数据集概述
数据集名称
cosqa-queries-corpus
数据集特征
- _id: 字符串类型
- partition: 字符串类型
- text: 字符串类型
- title: 字符串类型
- language: 字符串类型
- meta_information: 结构体类型,包含以下字段:
- dummy_field: 字符串类型
数据集分割
- queries:
- 字节数: 1474009
- 样本数: 20604
- corpus:
- 字节数: 6522597
- 样本数: 20604
数据集大小
- 下载大小: 3372990 字节
- 数据集总大小: 7996606 字节



