rasdani/germanrag-positives-queries
收藏Hugging Face2024-04-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/rasdani/germanrag-positives-queries
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个`pipeline.yaml`文件,可用于在Distilabel中使用`distilabel` CLI重现生成数据集的管道。数据集的结构包括每个配置的示例,特别是query_from_doc配置下的数据结构,包含答案、上下文、模型名称、正面上下文索引、查询和问题等字段。
提供机构:
rasdani
原始信息汇总
数据集概述
数据集名称
- 名称: germanrag-positives-queries
数据集创建工具
- 工具: Distilabel
数据集摘要
- 包含一个
pipeline.yaml文件,用于在distilabel中重现生成此数据集的管道。 - 可通过以下命令运行或查看配置:
distilabel pipeline run --config "https://huggingface.co/datasets/rasdani/germanrag-positives-queries/raw/main/pipeline.yaml"distilabel pipeline info --config "https://huggingface.co/datasets/rasdani/germanrag-positives-queries/raw/main/pipeline.yaml"
数据集结构
- 配置名称: query_from_doc
- 数据结构:
answer: 答案文本contexts: 上下文文本列表model_name: 模型名称(例如:gpt-3.5-turbo)positive_ctx_idx: 正上下文索引query: 查询问题query_gpt-3.5-turbo: 由模型生成的查询问题question: 问题文本
数据集加载
- 使用以下Python代码加载数据集: python from datasets import load_dataset ds = load_dataset("rasdani/germanrag-positives-queries", "query_from_doc")



