selfrag/selfrag_train_data
收藏Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/selfrag/selfrag_train_data
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于Self-RAG模型的训练数据文件,该文件生成多样化的用户查询输出以及反思标记,以自适应地调用检索系统并批评其输出和检索到的段落。Self-RAG模型在150k个多样化的指令-输出对上进行训练,这些对中穿插了段落和反思标记,使用标准的下一个标记预测目标,从而实现高效和稳定的学习,并提供细粒度的反馈。在推理过程中,利用覆盖生成多样方面的反思标记来采样与用户偏好一致的最佳输出。
This is a training dataset file for the Self-RAG model. It generates diverse user query-output pairs and reflection tokens to adaptively invoke the retrieval system and critique both its own outputs and the retrieved passages. The Self-RAG model is trained on 150,000 diverse instruction-output pairs, which are interleaved with passages and reflection tokens. By adopting standard next-token prediction objectives, this setup enables efficient and stable learning while providing fine-grained feedback. During inference, reflection tokens covering diverse aspects are utilized to sample the optimal outputs aligned with user preferences.
提供机构:
selfrag
原始信息汇总
数据集概述
数据集用途
- 用于训练Self-RAG模型,该模型能够生成针对多样化用户查询的输出,并生成反思令牌以自适应地调用检索系统,同时对其自身输出和检索到的段落进行批评。
数据集特点
- 生成多样化的用户查询响应。
- 包含反思令牌,用于自适应检索系统的调用。
- 对模型输出和检索段落进行自我批评。



