five

mtr-qwen35-fp8-12turn

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://huggingface.co/datasets/OkayestProgrammer/mtr-qwen35-fp8-12turn
下载链接
链接失效反馈
官方服务:
资源简介:
MTR Qwen3.5-FP8 12-Turn数据集是一个多轮对话检索数据集,通过MTR-Suite管道使用Qwen3.5-FP8(397B MoE)合成。该数据集专为文本检索任务设计,特别是对话搜索和多轮检索,适用于信息检索领域。数据集包含训练集和测试集,分别有107,928和12,000个样本。每个样本代表对话中的一个轮次,包含消息、文档池、真实文档索引等特征。数据集具有自然语言查询、硬主题切换和基于文档的回答等关键特性。适用于多轮对话检索任务的训练和评估。
创建时间:
2026-04-10
搜集汇总
数据集介绍
main_image_url
构建方式
在信息检索领域,多轮对话检索数据集对于评估和训练检索系统至关重要。该数据集采用合成方法构建,借助Qwen3.5-FP8这一大规模混合专家模型,通过SGLang框架生成对话内容。数据生成过程模拟真实对话场景,将每个对话划分为12轮,每轮作为一个独立的检索测试样本。对话历史被截断至特定轮次,并基于文档池为最后一轮用户查询标注了真实相关文档,确保了检索任务的针对性和可评估性。
特点
该数据集在对话检索任务中展现出独特的设计特性。其用户查询经过人性化处理,从第二轮开始引入自然语言表达如缩略词和代词,而首轮查询保持正式风格,模拟了真实对话的演变过程。约半数对话在随机轮次引入硬主题切换,增加了检索任务的挑战性。数据集完全基于文档内容构建,每轮查询均指向文档池中的具体信息,且每轮都标注了独立的真实文档索引,支持细粒度的检索性能分析。
使用方法
使用该数据集进行多轮检索研究时,可通过Hugging Face的datasets库直接加载。加载后,数据集提供训练集和测试集,分别包含大量对话轮次样本。研究人员可以访问每个样本的完整对话历史、候选文档池、真实文档索引及文本等字段,便于构建检索模型训练和评估流程。典型用法包括提取特定轮次的对话上下文,模拟系统在对话不同阶段的检索需求,进而测试模型在主题切换和自然语言变化下的鲁棒性。
背景与挑战
背景概述
在信息检索与对话系统研究领域,多轮检索任务旨在模拟真实对话场景中用户与系统基于历史上下文进行信息交互的复杂过程。MTR-Qwen3.5-FP8-12Turn数据集由OkayestProgrammer团队于近期构建,其核心研究问题聚焦于评估检索模型在长程、多轮对话中准确识别与当前查询最相关文档的能力。该数据集利用Qwen3.5-FP8大型语言模型合成生成,通过引入话题切换、自然语言改写等机制,显著提升了对话场景的仿真度与挑战性,为推进检索式对话系统的鲁棒性与上下文理解研究提供了重要基准。
当前挑战
该数据集旨在解决多轮对话检索中的核心挑战:模型需在长达12轮的对话历史中,准确捕捉用户意图的演变,并在约50%的对话中应对随机出现的话题切换,这对模型的长期依赖建模与话题边界检测能力提出了极高要求。在构建过程中,挑战主要集中于合成对话的自然性与真实性,即如何通过语言模型生成符合人类表达习惯的查询改写,并确保每轮对话均严格基于特定文档内容,同时维持文档池中候选文本的多样性与相关性,以构建既具规模又保真度的评估数据。
常用场景
经典使用场景
在多轮对话检索研究领域,MTR-Qwen3.5-FP8-12Turn数据集被广泛用于评估和训练检索模型在长对话上下文中的性能。该数据集模拟真实对话场景,包含多达12轮的对话历史,每轮对话都对应一个需要从候选文档池中检索出相关文档的任务。研究者利用这一数据集,能够深入探究模型如何基于逐步积累的对话信息,准确理解用户意图并定位关键文档,尤其在对话主题发生突然转换时,检验模型的适应性和鲁棒性。
实际应用
在实际应用中,MTR-Qwen3.5-FP8-12Turn数据集为构建智能客服系统、对话式搜索引擎以及个性化推荐引擎提供了关键训练与测试资源。系统可借助该数据集学习如何从多轮用户询问中捕捉深层需求,即使在对话中途话题发生跳跃,也能持续提供准确的文档或信息支持。这显著提升了对话代理在电商咨询、技术支持、教育问答等复杂场景中的实用性和用户满意度。
衍生相关工作
围绕该数据集,已衍生出一系列经典研究工作,包括基于注意力机制的对话状态跟踪模型、融合主题切换检测的检索架构,以及利用合成数据增强训练的策略。例如,配套的训练代码库mtr-suite和百万级文档集合MTR-DOCUMENT,共同构成了一个完整的多轮检索研究生态系统,激励了学术界在高效索引、上下文编码和对抗性主题转换等方向上的持续创新与探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作