deep-research-actions
收藏Hugging Face2025-10-25 更新2025-10-26 收录
下载链接:
https://huggingface.co/datasets/nbalepur/deep-research-actions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了用户的行为满意度、全部数据和报告满意度三种配置的数据。每种配置都包含了用户ID、查询、查询顺序、行为等信息,其中一些配置还包含了执行变化、推理类型、报告变化和策略等分类信息。数据集被划分为训练集、验证集和测试集,分别用于模型的训练、验证和测试。
This dataset contains data under three configurations: user behavior satisfaction, full data, and report satisfaction. Each configuration includes information such as user ID, query, query sequence, and behavior. Some of these configurations additionally incorporate categorized information including execution variation, inference type, report variation, and strategy. The dataset is divided into training, validation, and test sets, which are respectively utilized for model training, validation, and testing.
创建时间:
2025-10-25
原始信息汇总
数据集概述
基本信息
- 数据集名称: deep-research-actions
- 存储位置: https://huggingface.co/datasets/nbalepur/deep-research-actions
- 配置数量: 3个独立配置
配置详情
配置1: action_satisfaction
数据特征:
- user_id (int64)
- query (string)
- query_order (int64)
- action (string)
- categories (结构体)
- execution_change (string)
- inference_type (string)
- report_change (string)
- strategy (string)
- action_score (int64)
- report_score (string)
- action_cot (string)
- report_cot (string)
数据分割:
- 训练集: 5,660个样本,1,769,721字节
- 验证集: 970个样本,316,632字节
- 测试集: 951个样本,311,980字节
存储信息:
- 下载大小: 648,376字节
- 数据集大小: 2,398,333字节
配置2: all
数据特征:
- user_id (int64)
- query (string)
- query_order (int64)
- action (string)
- categories (结构体)
- execution_change (string)
- inference_type (string)
- report_change (string)
- strategy (string)
- action_score (int64)
- report_score (int64)
- action_cot (string)
- report_cot (string)
数据分割:
- 训练集: 7,581个样本,2,974,240字节
存储信息:
- 下载大小: 934,217字节
- 数据集大小: 2,974,240字节
配置3: report_satisfaction
数据特征:
- user_id (int64)
- query (string)
- query_order (int64)
- action (string)
- categories (结构体)
- execution_change (string)
- inference_type (string)
- report_change (string)
- strategy (string)
- action_score (string)
- report_score (int64)
- action_cot (string)
- report_cot (string)
数据分割:
- 训练集: 3,729个样本,1,263,554字节
- 验证集: 603个样本,213,980字节
- 测试集: 621个样本,219,091字节
存储信息:
- 下载大小: 532,392字节
- 数据集大小: 1,696,625字节
文件结构
- action_satisfaction配置: 包含train、val、test分割
- all配置: 仅包含train分割
- report_satisfaction配置: 包含train、val、test分割
搜集汇总
数据集介绍

构建方式
在信息检索与智能决策研究领域,deep-research-actions数据集通过结构化标注方法构建,涵盖用户查询序列、行为动作及多维分类体系。数据采集自真实交互场景,每个样本包含用户标识、查询内容及顺序,并针对行为与报告分别标注执行变更、推理类型等分类属性,辅以人工评分的动作与报告分数,确保数据质量与一致性。数据集按研究目标划分为三个独立配置,分别聚焦动作满意度、报告满意度及综合评估,各配置均提供训练、验证与测试分割,支持严谨的模型训练与评估流程。
特点
该数据集的核心特征在于其丰富的多维度标注体系与细粒度评估指标。每个样本不仅记录用户查询与行为序列,还通过结构化字段详细刻画动作的分类特性,如策略类型与推理模式,同时包含动作与报告的思维链解释,为理解决策过程提供深度洞察。数据规模适中,三个配置分别包含数千至近万条样本,覆盖多样化的研究场景,且评分字段采用数值与字符串混合形式,适应不同分析需求。数据分割科学,支持模型开发中的泛化能力验证,体现了在复杂决策任务中数据表征的全面性与实用性。
使用方法
针对该数据集的应用,研究人员可依据具体任务选择相应配置进行模型训练与评估。例如,使用action_satisfaction配置可专注于行为满意度预测,而report_satisfaction配置则适用于报告质量分析;all配置提供完整数据以支持综合研究。加载数据时,通过指定配置名称与分割路径即可访问训练、验证或测试集,利用特征字段如动作分数、报告分数及分类结构构建预测或分类模型。数据格式兼容常见机器学习框架,支持端到端流程,从特征提取到模型优化,助力于智能决策系统的开发与性能提升。
背景与挑战
背景概述
在信息检索与智能决策系统蓬勃发展的背景下,deep-research-actions数据集应运而生,聚焦于用户研究行为的多维度评估。该数据集通过结构化记录用户查询序列、执行动作及反馈评分,旨在解析复杂研究任务中的行为模式与策略有效性。其设计融合了执行变更、推理类型等分类维度,为理解人机交互过程中的认知决策机制提供了实证基础。
当前挑战
该数据集需应对研究行为量化评估的固有复杂性:如何精准定义动作与报告的质量评分标准构成核心难题,涉及主观性与可复现性的平衡。构建过程中,多维度标注的一致性面临挑战,例如跨用户行为分类的标准化、时序动作链的连贯性维护,以及文本推理与数值评分间的语义对齐问题。
常用场景
经典使用场景
在信息检索与智能决策系统领域,deep-research-actions数据集通过记录用户查询序列、交互行为及多维度分类标签,为研究复杂任务下的行动策略演化提供了丰富素材。该数据集典型应用于训练序列预测模型,分析用户在多轮对话中如何调整执行计划与推理方式,从而揭示认知决策的动态过程。
实际应用
面向智能助手与专业研究工具开发,该数据集支撑了自适应决策系统的优化。通过分析用户行为模式与满意度关联,可构建能动态调整检索策略的对话系统。在教育培训领域,其记录的思维链数据为构建具备教学反馈能力的智能导师系统提供了关键训练素材。
衍生相关工作
基于该数据集衍生的经典研究包括多模态推理框架的构建,其中行动策略分类体系被广泛应用于增强模型的决策透明度。其提供的思维链标注范式催生了新一代可解释AI评估基准,多个团队据此开发了能同时优化执行路径与最终输出的端到端训练方法。
以上内容由遇见数据集搜集并总结生成



