docs-eval-v1
收藏数据集概述:Enscrive Docs Eval — v1
基本信息
- 数据集名称:Enscrive Docs Eval — v1
- 许可证:CC-BY-4.0
- 语言:英文(en)
- 任务类别:文本检索(text-retrieval),具体为文档检索(document-retrieval)
- 标签:神经搜索、基准测试、文档、信息检索、RAG
- 数据规模:小规模(n<1K)
数据集描述
该数据集是针对 Enscrive 开发者文档的问答评估数据集。查询代表开发者在集成 Enscrive 的 /v1 API 时可能键入的典型问题。每个查询都配对了预期源文档(Markdown 文件名)以及该文档中最直接回答该问题的 H2/H3 章节锚点。
数据状态
- 版本:v1.0.0(2026-05-13)
- 规模:包含 44 个查询/预期文档对,源自 11 个源 Markdown 文件。
文件结构
数据集采用 BeIR 格式,通过一个 Croissant 清单文件引用三个 Parquet 文件:
| 文件路径 | 用途 |
|---|---|
data/corpus.parquet |
11 个源文档(_id, text, title) |
data/queries.parquet |
44 个评估查询(_id, text) |
data/qrels.parquet |
44 个相关性判断(query-id, corpus-id, score) |
croissant.json |
Croissant 1.0 清单,将以上三者绑定 |
data/qa_pairs.jsonl / data/qa_pairs.parquet |
扁平化的非规范化视图,便于使用 |
README.md |
本卡片 |
记录格式(BeIR Croissant)
- corpus(语料库):
_id(字符串):源 Markdown 文件名text(字符串):完整的 Markdown 正文(不含前置元数据)title(字符串):来自 YAML 前置元数据的页面标题
- queries(查询):
_id(字符串):稳定查询标识符(qNNN)text(字符串):开发者键入的查询文本
- qrels(相关性判断):
query-id(字符串):外键,关联queries._idcorpus-id(字符串):外键,关联corpus._idscore(浮点数):相关性评分(本数据集每个查询仅一个预期文档,评分为1.0)
源语料库
数据集涵盖 11 个 Markdown 文件(来自 enscrive-developer/docs/public/ 目录):
index.md, principles.md, concepts.md, auth.md, errors.md, corpora.md, voices.md, search.md, ingest.md, jobs.md, batch-sets.md。
这些文件与 api.enscrive.io/docs 的 /docs 端点提供的文档相同。
方法论
- 创作流程:两阶段流水线,两阶段均使用 Anthropic Opus。
- 草稿:Opus 生成 30-60 条实际开发者可能键入的查询,注重措辞、缩写和意图的多样性。
- 新视角精炼:单独的 Opus 会话根据三条规则(无逐字引用、无单一语块构造痕迹、无模型式表达)审查并编辑或拒绝查询。
- 结果:精炼后共产生 44 条查询。
- 评估指标:该数据集用于计算以下指标:
- MRR:预期文档在所有查询中的平均倒数排名。
- recall@10:预期文档出现在前 10 个结果中的查询比例。
- nDCG@10:排名第 10 位的归一化折损累计增益。
数据覆盖范围
覆盖范围根据实际开发者兴趣加权。每个源文件的查询数量如下:
| 源文件 | 查询数量 |
|---|---|
corpora.md |
7 |
ingest.md |
7 |
search.md |
6 |
voices.md |
5 |
jobs.md |
5 |
batch-sets.md |
4 |
auth.md |
3 |
errors.md |
2 |
concepts.md |
2 |
principles.md |
2 |
index.md |
1 |
| 总计 | 44 |
基准结果
经过三次评估迭代,平台默认语音配置达到了检索上限:Recall@10 = 1.000, MRR = 0.8625, nDCG@10 = 0.8976。
引用
如需引用该数据集,请使用以下 BibTeX 格式:
bibtex @misc{enscrive_docs_eval_v1_2026, author = {Enscrive}, title = {Enscrive Docs Eval — v1}, year = {2026}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/Enscrive-IO/docs-eval-v1} }




