iVenture-Studio-Refinery
收藏Hugging Face2026-04-13 更新2026-04-14 收录
下载链接:
https://huggingface.co/datasets/Pippinlitli/iVenture-Studio-Refinery
下载链接
链接失效反馈官方服务:
资源简介:
iVenture Studio Industrial Refinery (ULTRA-HARD) 是一个商业级的高质量数据集,专门设计用于增强大型语言模型的逻辑推理能力。该数据集包含“认知黄金”级别的超难推理轨迹(硬度评分8+),涵盖金融、法律、生物技术和网络安全四个关键行业领域,源自19个独特的上游数据集。数据以JSONL格式提供,适用于监督微调(SFT)和强化学习(RLHF/GRPO)流程。每个推理轨迹都经过严格的模型即法官(Model-as-Judge)验证循环,确保高质量和逻辑严密性。数据集采用严格的清洁室合成流程生成,保证完全专有所有权。商业使用需要付费许可,学术和非商业研究可免费使用但需注明出处。
创建时间:
2026-04-12
原始信息汇总
iVenture Studio Industrial Refinery (ULTRA-HARD) 数据集概述
数据集基本信息
- 数据集名称:iVenture Studio Industrial Refinery (ULTRA-HARD)
- 访问状态:受控访问,仅限授权
- 许可证:iventure-studio-data-license-v1
- 任务类别:文本生成、问答
- 语言:英语
- 数据规模:10K<n<100K
- 标签:商业级、认知黄金、合成数据、推理轨迹、深度推理、多跳推理、思维链、超难、GRPO验证
数据集状态与质量
- 当前状态:商业级,仅包含超难推理轨迹。
- 质量转向通知:数据集现仅包含超难推理轨迹,所有被错误拒绝的轨迹已被清除。第1层原始轨迹正在通过GRPO管道系统性地重新处理,仅在其获得超难认证后才会发布。数据集正在向100%超难标准过渡。
- 质量层级目标:
- 超难:硬度分数8-9,目标百分比100%。
- 第1层:硬度分数5,目标百分比0%,正在重新处理。
- 被错误拒绝:硬度分数0,目标百分比0%,已从存储库中永久移除。
- 重新处理通知:约40,000个第1层原始轨迹正在通过GRPO管道重新处理。成功升级的轨迹将添加到数据集中。
领域构成
数据集涵盖四个关键行业垂直领域,源自19个独特的上游数据集:
- 金融:2,981个文件,源自
finance-instruct-500k、financebench、finance_alpaca_azerbaijan,聚焦投资组合推理、定量分析、风险评估。 - 法律:2,977个文件,源自
legalbench、legal-contract-clause-risk-corpus、legalcitationworthiness、vietnamese-legal-documents,聚焦跨境合同风险、引文分析、合规性。 - 生物技术:2,977个文件,源自
events_classification_biotech、hack5,聚焦临床试验方案合成、生物医学事件推理。 - 网络安全:2,985个文件,源自
cybersecurity-ner、trendyol-cybersecurity-instruction-tuning-dataset,聚焦威胁向量推理、命名实体识别、攻击路径推演。
数据格式与模式
- 格式:JSONL格式,适用于监督微调和强化学习管道。
- 模式:
instruction:需要深度分析的复杂问题或场景。reasoning_trace:多步骤逻辑推演过程。final_answer:综合结论或答案。metadata:包含引擎、垂直领域、时间戳、硬度分数、质量层级。
质量保证与生产流程
- VIC-0引擎:由高度优化的
Qwen2.5-7B和Gemini-2.5-Pro通过skywork-deepresearch-v2引擎驱动。 - 洁净室合成:采用5层洁净室管道,仅从源材料中提取非版权事实和逻辑,合成全新的推理轨迹。
- 模型即法官验证:每个轨迹都经过严格的验证循环,通过群体相对策略优化进行评分。
- 认知提升:内部测试表明,与标准监督微调基线相比,使用此数据集微调的模型推理能力平均提升14.2%。
基准比较
| 指标 | 典型监督微调数据集 | iVenture精炼厂 | 差异 |
|---|---|---|---|
| 推理深度 | 1-2跳 | 3+跳 | +150% |
| 领域特异性 | 通用知识 | 金融、法律、生物技术、网络安全 | 高度专业化 |
| 验证方法 | 人工/启发式 | 模型即法官 | 更高一致性 |
| 独特源数据集 | 1-3个 | 19个 | 广泛覆盖 |
| 质量标准 | 无/混合 | 100%超难 | 严格质量门控 |
| 预计认知提升 | 基线 | +14.2% | 显著 |
使用示例
- 加载数据集:需提供Hugging Face令牌。
- 免费样本:可在
https://huggingface.co/datasets/Pippinlitli/iVenture-Studio-Refinery-Sample获取,用于评估。
商业许可
- 学术与非商业研究:免费使用,需注明出处。
- 商业用途:在任何商业产品、服务或企业模型训练中使用前,必须获得付费许可协议。
- 许可层级:
- 初创企业:收入低于1000万美元,年费15,000美元。
- 企业:收入1000万美元以上,年费75,000至150,000美元。
- 完整条款:请参阅存储库中的
LICENSE.md文件。
引用
如需在研究中引用此数据集,请使用提供的BibTeX格式。
免责声明
此存储库提供的数据是合成生成的,用于训练AI模型的逻辑推理能力。数据按“原样”提供,不作任何保证。推理轨迹在其生成的上下文中逻辑上是合理的,但不应替代专业的金融、法律、医疗或网络安全建议。完整条款请参阅LICENSE.md。
搜集汇总
数据集介绍

构建方式
在人工智能模型训练领域,高质量推理数据的构建是提升模型逻辑能力的关键。iVenture Studio Industrial Refinery数据集通过其专有的VIC-0引擎,在洁净室合成管道中生成推理轨迹。该流程从19个上游数据集中提取非版权性事实与逻辑,并利用经过优化的Qwen2.5-7B和Gemini-2.5-Pro模型,通过skywork-deepresearch-v2引擎合成全新的多跳推理链。每一轨迹均需通过基于群体相对策略优化的模型即法官验证循环,仅当硬度评分达到8及以上的ULTRA-HARD标准时,才会被纳入最终的商业级数据集中。
特点
该数据集的核心特征在于其严格的质量标准和领域专业性。所有数据均达到ULTRA-HARD级别,专注于深度推理与复杂问题解决,平均推理深度超过三个逻辑跳跃。数据集覆盖金融、法律、生物技术和网络安全四大关键行业垂直领域,确保了高度的领域特异性。其数据格式为JSONL,专为监督微调和强化学习管道设计,每条记录包含指令、推理轨迹、最终答案及包含引擎、垂直领域、时间戳和已验证硬度评分等元数据。与典型的监督微调数据集相比,它在推理深度、验证方法和来源广度上均有显著提升。
使用方法
对于希望利用该数据集的研究者或开发者,其使用流程需遵循特定的访问规范。由于数据集处于门控访问状态,用户需提供Hugging Face令牌并通过`datasets`库加载,推荐使用流式传输模式以高效探索大规模数据。数据可直接集成到监督微调或强化学习训练管道中,用于增强大型语言模型的逻辑演绎能力。学术与非商业研究在注明出处的前提下可免费使用,而任何商业用途均需事先获取付费许可协议。企业级许可还包含来源保证、知识产权赔偿以及生产级微调管道集成的专门支持。
背景与挑战
背景概述
iVenture Studio Industrial Refinery (ULTRA-HARD) 数据集由 iVenture Studio 于2026年创建,旨在通过提供商业级、超高难度的推理轨迹来增强大型语言模型的逻辑演绎能力。该数据集基于专有的 VIC-0 引擎,在洁净室合成管道中生成,覆盖金融、法律、生物技术和网络安全四大专业领域,源自19个独特上游数据集。其核心研究问题聚焦于解决复杂多跳推理和深度逻辑分析任务,通过严格的模型即法官验证循环确保数据质量,对推动人工智能在专业垂直领域的推理能力发展具有显著影响力。
当前挑战
该数据集致力于解决专业领域内复杂推理任务的挑战,例如在金融风险评估、法律合同分析、生物医学事件推理和网络安全威胁路径推导中,模型需要处理多步骤逻辑链和高度专业化的知识。在构建过程中,挑战包括确保推理轨迹达到超高硬度评分(8分以上)的质量标准,这要求严格的模型即法官验证和 GRPO 管道处理;同时,从非版权事实中合成全新推理轨迹以避免表达性复制,并实现从原始层级到超高硬度层级的系统性升级,这些过程均涉及高效的数据清洗与质量管控。
常用场景
经典使用场景
在大型语言模型逻辑推理能力增强领域,iVenture-Studio-Refinery数据集主要应用于监督微调与强化学习训练流程。其精心构建的多跳推理轨迹,为模型提供了从复杂指令到最终答案的完整演绎链条,尤其适用于需要深度逻辑推演的少样本学习场景。该数据集通过展示专业领域内的高难度问题解决过程,使模型能够内化高级推理模式,从而显著提升在金融、法律等垂直领域的认知表现。
解决学术问题
该数据集有效应对了当前大语言模型在复杂逻辑推理与领域专业知识融合方面的研究瓶颈。通过提供经过严格验证的“认知黄金”标准推理轨迹,它解决了传统训练数据在推理深度、逻辑连贯性和领域特异性上的不足。其意义在于为模型认知能力的量化提升提供了高质量基准,推动了从浅层模式匹配到深度逻辑演绎的范式转变,对构建具备专业领域决策能力的可信人工智能系统具有重要影响。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在高质量合成数据生成与评估方法论上。其采用的清洁室合成管道与模型即法官验证循环,为后续研究提供了可复制的数据生产框架。基于分组相对策略优化的硬度评分机制,催生了新一代推理能力评估标准。此外,其在金融、法律等垂直领域的深度标注范式,也启发了众多面向专业场景的领域自适应与知识蒸馏研究。
以上内容由遇见数据集搜集并总结生成



