five

glaiveai/RAG-v1

收藏
Hugging Face2024-06-25 更新2024-06-26 收录
下载链接:
https://hf-mirror.com/datasets/glaiveai/RAG-v1
下载链接
链接失效反馈
官方服务:
资源简介:
Glaive-RAG-v1是一个包含约50,000个样本的数据集,使用Glaive平台构建,用于微调模型以适应RAG(检索增强生成)应用场景。每个样本包括上下文文档列表、问题、回答模式和回答。回答模式定义了模型是否应仅输出基于文档的回答,还是应结合其内部信息。回答中引用了文档,并使用特定标签标记引用。

Glaive-RAG-v1 is a dataset with ~50k samples built using the Glaive platform, for finetuning models for RAG use cases. Each row has a list of documents for context, a question, an answer mode, and an answer. The answer mode defines if the model should output only grounded responses or if it should combine its internal information as well. The answers include cited documents at the beginning and also <co: 1></co> tags in the text to mark citations.
提供机构:
glaiveai
原始信息汇总

Glaive-RAG-v1 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 数据规模: 10K < n < 100K
  • 标签:
    • code
    • synthetic
    • rag
  • 语言: 英语 (en)

数据集描述

  • 样本数量: 约50,000个
  • 构建平台: Glaive
  • 应用场景: 用于微调模型以适应RAG(Retrieval-Augmented Generation)用例

数据结构

  • 每行数据包含:
    • 上下文文档列表
    • 问题
    • 回答模式
    • 答案
  • 回答模式: 定义模型是否应仅输出基于上下文的回答,或结合内部信息生成回答
  • 答案格式:
    • 开头包含引用的文档
    • 文本中包含 <co: 1></co> 标签标记引用
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作