RAG-v1
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/RAG-v1
下载链接
链接失效反馈官方服务:
资源简介:
Glaive-RAG-v1 仓库提供约 5 万条样本的数据集,专门用于微调模型以适应 RAG(检索增强生成)的使用场景。数据集包含上下文文档列表、问题、答案模式和答案。答案模式定义了模型是仅输出基于检索的响应,还是结合其内部信息。答案以引用的文档开头,并使用 `<co: 1></co>` 标签在文本中标记引用。本数据集采用 Apache 2.0 许可。
The Glaive-RAG-v1 repository provides a dataset of approximately 50,000 samples, specifically designed for fine-tuning models to adapt to RAG (Retrieval-Augmented Generation) scenarios. The dataset includes context document lists, questions, answer modes and final answers. The answer mode defines whether the model should only output retrieval-based responses, or combine them with its internal knowledge. Each answer starts with the cited document, and uses `<co: 1></co>` tags to mark citations in the text. This dataset is licensed under Apache 2.0.
创建时间:
2024-07-19
搜集汇总
数据集介绍

背景与挑战
背景概述
Glaive-RAG-v1是一个包含约5万条样本的数据集,专门用于微调模型以适应检索增强生成(RAG)场景。每条样本提供上下文文档、问题、答案模式和答案,其中答案模式指导模型输出是否仅基于检索或结合内部知识,答案部分以引用文档开头并使用标签标记引用,便于训练模型生成准确且可追溯的响应。
以上内容由遇见数据集搜集并总结生成



