five

sciworld-rollout-dataset-test

收藏
Hugging Face2025-10-23 更新2025-10-24 收录
下载链接:
https://huggingface.co/datasets/mfirth/sciworld-rollout-dataset-test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含多种科学实验和观察任务的数据库,如煮沸、改变物质状态、测量导电性、寻找生物、混合化学物质、了解生物生命周期等。每个任务都有详细描述,并且提供了相应的数据量信息。

This is a database encompassing a variety of scientific experiments and observational tasks, such as boiling, altering states of matter, measuring electrical conductivity, searching for organisms, mixing chemical substances, and understanding biological life cycles. Each task is accompanied by detailed descriptions and corresponding data volume information.
创建时间:
2025-10-23
原始信息汇总

SciWorld Rollout Dataset Test 数据集概述

数据集基本信息

  • 数据集名称: sciworld-rollout-dataset-test
  • 总下载大小: 61,642,906 字节
  • 总数据集大小: 494,179,650 字节
  • 配置名称: default

数据结构

特征字段

  • task_name: 字符串类型
  • task_description: 字符串类型
  • variation_idx: 整型(int64)
  • trajectory: 列表类型,包含:
    • action: 字符串类型
    • inventory: 字符串类型
    • observation: 字符串类型

数据划分详情

任务1:物质状态变化

  • task1boil: 29,440个样本,25,953,602字节
  • task1changethestateofmatterof: 1,540个样本,7,004,523字节
  • task1freeze: 2,072个样本,12,041,012字节
  • task1melt: 1,848个样本,9,734,890字节

任务2:电学与导电性测试

  • task2powercomponentrenewablevsnonrenewableenergy: 836个样本,3,386,139字节
  • task2powercomponent: 496个样本,901,402字节
  • task2atestconductivity: 1,750个样本,4,440,501字节
  • task2atestconductivityofunknownsubstances: 19,000个样本,49,359,830字节

任务3:生物识别

  • task3findlivingthing: 7,624个样本,12,009,998字节

任务4:植物生长

  • task4growplant: 2,500个样本,22,561,848字节

任务5:化学混合

  • task5chemistrymix: 1,788个样本,9,189,064字节
  • task5chemistrymixpainttertiarycolor: 1,780个样本,4,982,799字节
  • task5chemistrymixpaintsecondarycolor: 1,160个样本,2,266,961字节

任务6:寿命研究

  • task6lifespanlongestlived: 1,440个样本,1,453,479字节
  • task6lifespanlongestlivedthenshortestlived: 1,688个样本,1,971,853字节
  • task6lifespanshortestlived: 1,440个样本,1,456,437字节

任务7:生命阶段识别

  • task7identifylifestages1: 788个样本,2,612,771字节
  • task7identifylifestages2: 220个样本,756,373字节

任务8:斜面实验

  • task8inclinedplanefrictionnamedsurfaces: 5,500个样本,126,063,648字节
  • task8inclinedplanedetermineangle: 8,250个样本,79,713,819字节

任务10:温度测量

  • task10usethermometer: 17,500个样本,58,148,852字节
  • task10measuremeltingpointknownsubstance: 10,000个样本,58,169,849字节
搜集汇总
数据集介绍
main_image_url
构建方式
在科学教育仿真环境领域,sciworld-rollout-dataset-test数据集通过系统化的任务轨迹记录构建而成。该数据集涵盖物质状态变化、能量转换、化学实验等多元科学主题,每个任务均以轨迹序列形式记录,包含行动指令、环境状态和观测结果三个核心维度。数据采集过程模拟真实科学探究场景,通过标准化实验流程生成具有时序逻辑的交互记录,形成覆盖20个专项任务的完整知识体系。
特点
该数据集最显著的特征在于其多模态的任务设计架构。每个任务单元均配备详细的任务描述和变体索引,轨迹数据采用结构化存储方式,完整呈现行动序列与状态变化的对应关系。数据集规模达49GB,包含从基础物理实验到复杂化学反应的广泛科学场景,其中热力学测量和斜面摩擦实验等任务具有特别丰富的样本容量。这种设计使得数据集既能保持科学概念的准确性,又具备教学场景的实用性。
使用方法
针对科学教育智能体的训练需求,使用者可通过HuggingFace平台按任务分割灵活加载数据。每个独立任务文件包含完整的交互轨迹,研究人员可根据具体实验目标选择相应任务子集。数据加载后可直接用于强化学习训练、行为克隆或轨迹分析等场景,轨迹中的行动-观测对能为智能体提供连续决策的监督信号。建议根据任务复杂度和数据量级进行分批处理,以优化模型训练效率。
背景与挑战
背景概述
SciWorld-rollout-dataset-test作为科学教育领域的重要资源,聚焦于交互式科学模拟环境中的智能体行为轨迹记录。该数据集由专业研究团队构建,旨在捕捉多任务科学探索过程中的决策序列,涵盖物质状态变化、能量转换、生物生命周期等核心科学概念。其设计初衷在于为强化学习与科学推理模型的训练提供结构化数据支持,通过记录动作序列、观察状态与库存变化等关键特征,推动教育人工智能在复杂科学问题解决能力方面的发展。
当前挑战
该数据集需应对科学概念多模态表达的复杂性挑战,例如物质相变过程中非确定性观测数据的表征难题。构建过程中面临实验轨迹完整性与噪声控制的平衡问题,既要保证高温测量等高风险操作的数据真实性,又需处理传感器读数异常等干扰因素。此外,跨任务知识迁移的泛化要求对数据标注一致性提出更高标准,例如导电性测试中材料属性的动态变化需与能量转换任务建立语义关联。
常用场景
经典使用场景
在科学教育仿真环境中,该数据集通过多任务轨迹记录为智能体决策过程研究提供了丰富素材。其涵盖物质状态变化、能量转换、化学混合等经典物理化学实验场景,每条轨迹包含动作序列、状态观察和物品清单的完整交互记录,特别适用于序列决策模型的训练与验证。研究人员可基于这些结构化轨迹分析智能体在复杂科学任务中的推理路径,为教育人工智能的发展奠定数据基础。
实际应用
该数据集在自适应教育系统开发中展现出重要价值。教育科技公司可借助其轨迹数据优化虚拟实验室的智能辅导系统,通过分析专家演示轨迹构建个性化学习路径。在教师培训领域,这些标准化实验轨迹可作为教学示范素材,帮助新晋教师掌握科学实验教学的关键环节。此外,智能教育硬件厂商也能利用该数据集训练嵌入式AI助手,提升其指导学生完成科学探究的准确性与交互性。
衍生相关工作
基于该数据集衍生的经典研究包括科学推理智能体的分层强化学习框架,该工作通过解构复杂实验步骤提升了模型的任务完成率。另有研究团队开发了轨迹分析算法,能够自动识别学生实验过程中的认知偏差,为智能教育干预提供技术支持。在跨模态学习领域,有学者利用该数据集构建了文本指令与实验动作的映射模型,推动了自然语言指导的科学实验自动化研究进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作