agentic_multistep_Qwen3-4B

Hugging Face2025-11-13 更新2025-11-14 收录

下载链接：

https://huggingface.co/datasets/DLBDAlkemy/agentic_multistep_Qwen3-4B

下载链接

链接失效反馈

官方服务：

资源简介：

cqadupstack数据集包含了查询及其重写版本、最终答案、查询处理时间、查询处理的令牌数等信息。fiqa数据集与cqadupstack数据集类似，也包含了查询及其重写版本、最终答案等信息，但是部分字段的数据类型有所不同。

The cqadupstack dataset contains information including queries, their rewritten versions, final answers, query processing time, and the number of tokens utilized for query processing. The fiqa dataset is similar to the cqadupstack dataset, which also includes queries, their rewritten versions, final answers and other related information, but the data types of some fields are different.

创建时间：

2025-11-08

原始信息汇总

数据集概述

基本信息

数据集名称: agentic_multistep_Qwen3-4B
存储位置: https://huggingface.co/datasets/DLBDAlkemy/agentic_multistep_Qwen3-4B
配置数量: 2个独立配置(cqadupstack, fiqa)

配置详情

cqadupstack配置

数据量: 1,571个训练样本
数据大小: 21,419,607字节
下载大小: 6,659,644字节

特征结构

final_answer: 字符串类型
first_rewritten_query: 字符串类型
full_trace: 字符串类型
id: 整型(int64)
last_rewritten_query: 字符串类型
query: 字符串类型
total_seconds_first_rewriting: 浮点型(float64)
total_seconds_last_rewriting: 浮点型(float64)
total_tokens: 字符串类型
total_tokens_first_rewriting: 字符串类型
total_tokens_last_rewriting: 字符串类型
query_id: 字符串类型
gt_doc_ids: 字符串列表
gt_doc_chunks: 字符串列表

fiqa配置

数据量: 648个训练样本
数据大小: 10,960,637字节
下载大小: 5,261,073字节

特征结构

id: 整型(int64)
query: 字符串类型
first_rewritten_query: 字符串类型
last_rewritten_query: 浮点型(float64)
final_answer: 字符串类型
total_tokens_first_rewriting: 字符串类型
total_tokens_last_rewriting: 字符串类型
total_tokens: 字符串类型
total_seconds_first_rewriting: 浮点型(float64)
total_seconds_last_rewriting: 浮点型(float64)
full_trace: 字符串类型
query_id: 字符串类型
gt_doc_ids: 字符串列表
gt_doc_chunks: 字符串列表

数据文件结构

cqadupstack配置训练数据路径: cqadupstack/train-*
fiqa配置训练数据路径: fiqa/train-*

搜集汇总

数据集介绍

构建方式

在智能问答系统研究领域，该数据集通过多步骤查询重构机制构建而成。基于CQADupStack和FiQA两个专业数据集，采用Qwen3-4B模型对原始查询进行迭代式重写，记录从初始查询到最终答案生成的完整轨迹。构建过程精确捕捉每次查询重写的时间消耗和令牌使用量，形成包含1571个CQADupStack样本和648个FiQA样本的训练集，每个样本均配备真实文档标识和内容片段作为基准参考。

使用方法

研究人员可通过加载指定配置名称快速访问不同领域的数据子集，如cqadupstack或fiqa。利用数据集中的时序和令牌统计信息，可深入分析查询重构效率与答案质量间的关联规律。full_trace字段支持对模型推理过程的逐步解析，而标准答案文档的对照设计便于进行答案准确性的定量评估。该数据集特别适用于研究多步推理模型优化、查询重构策略比较等前沿课题。

背景与挑战

背景概述

在人工智能领域，多步骤推理任务的研究日益受到重视，agentic_multistep_Qwen3-4B数据集应运而生。该数据集由前沿研究团队基于Qwen语言模型构建，聚焦于复杂查询的逐步重写与答案生成问题。其核心在于探索智能代理如何通过迭代式查询优化来提升信息检索的准确性与连贯性，为自然语言处理中的交互式系统提供了关键数据支持，推动了对话代理与知识推理技术的融合创新。

当前挑战

该数据集旨在应对多步骤查询重写与答案生成中的语义连贯性挑战，要求模型在动态调整查询时保持逻辑一致性。构建过程中，数据采集面临标注复杂性的障碍，需精确记录每次重写的时间与令牌消耗，并确保真实文档片段的准确对齐。此外，处理异构来源如CQADupStack和FiQA时，统一多域数据的格式与质量也构成了显著难题。

常用场景

经典使用场景

在自然语言处理领域，agentic_multistep_Qwen3-4B数据集为多步查询重写与答案生成任务提供了关键支持。该数据集通过记录查询的初始形式、多次重写过程及最终答案，典型应用于训练智能代理系统进行迭代式信息检索，帮助模型学习如何在复杂对话中动态优化查询策略，提升多轮交互的连贯性与准确性。

解决学术问题

该数据集有效应对了开放域问答系统中查询歧义性与上下文依赖性的核心挑战。通过提供完整的重写轨迹与标注答案，它使研究者能够深入分析查询演化机制，推动了对语义理解、推理链构建等基础问题的研究，为构建具备自我修正能力的人工智能系统奠定了数据基础。

实际应用

在实际应用层面，该数据集支撑的智能代理技术已广泛应用于金融咨询与技术支持场景。例如在FiQA子集中，系统通过连续查询优化可精准解析用户复杂的投资疑问，自动生成专业级财务分析报告；在CQADupStack技术社区场景中，则能通过多轮交互定位程序错误根源，显著提升知识服务的效率与可靠性。

数据集最近研究