TinyStories-Plus-Interaction-SFT
收藏Hugging Face2025-06-21 更新2025-06-22 收录
下载链接:
https://huggingface.co/datasets/ReactiveAI/TinyStories-Plus-Interaction-SFT
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于TinyStories的交互式监督微调数据集,包含了约10万条从基础数据集中提取的示例和约10万条新生成的示例,总共约20万条记录。数据集用于Reactive Transformer架构的模型在第二阶段的训练,特别是在处理单个序列(交互)时。数据集包含两个字段:'query'(查询)和'answer'(回答),适合于小型研究模型的训练。
创建时间:
2025-06-21
原始信息汇总
数据集概述:ReactiveAI/TinyStories-Plus-Interaction-SFT
数据集描述
- 目的:用于Reactive Transformer架构的第二阶段训练(监督微调),专为处理单序列交互设计。
- 基础数据:基于roneneldan/TinyStories生成,包含合成问答对。
- 语言:英文
- 许可证:Apache-2.0
- 维护者:Adam Filipek / Reactive AI
数据集结构
- 字段:
query(字符串):用户查询answer(字符串):模型回答
- 数据量:
- 训练集(train):201,759条(约109.5MB)
- 验证集(validation):22,683条(约12.2MB)
- 限制:每条记录总长度≤256 tokens,且
query显著短于answer
数据生成与处理
- 生成工具:使用Qwen3-4b模型(通过Novita平台)批量生成,温度参数0.7。
- 后处理:
- 去偏处理:替换高频重复的200个人名为1000个随机新名。
- 数据来源:纯合成数据,无真实世界知识。
使用场景
- 适用场景:微调小型研究模型(如RxT-Alpha-Micro)。
- 限制:
- 仅适用于研究,不可用于生产。
- 可能存在生成主题相似性偏差(同批次20条数据)。
风险提示
- 潜在风险:极少数数据可能隐含模型训练时的真实世界知识偏差。
- 建议:严格限于微型模型实验用途。
联系方式
- Adam Filipek:adamfilipek@rxai.dev
搜集汇总
数据集介绍

构建方式
在自然语言处理领域,交互式监督微调数据集对于模型训练至关重要。TinyStories-Plus-Interaction-SFT数据集基于roneneldan/TinyStories数据集构建,专为Reactive Transformer架构的实验模型设计。该数据集通过Qwen3-4b模型生成约20万条交互记录,每条记录包含query和answer两个文本字段,总长度不超过256个token。生成过程中采用0.7的温度参数以平衡多样性和一致性,并对高频重复名称进行了替换处理以消除潜在偏见。
使用方法
该数据集适用于Reactive Transformer架构模型的监督微调阶段,特别是RxT-Alpha-Micro系列模型的训练。使用时需注意其交互式特性,模型应按照[Q]query[A]answer的格式处理数据流。由于数据完全合成且规模有限,建议仅用于研究目的,避免部署到生产环境。训练过程中推荐配合数据洗牌策略,以缓解生成批次内的主题相似性问题,充分发挥其在小规模模型训练中的价值。
背景与挑战
背景概述
TinyStories-Plus-Interaction-SFT数据集由Reactive AI的Adam Filipek团队于近期开发,旨在为基于Reactive Transformer架构的实验性模型提供监督微调数据。该数据集基于roneneldan/TinyStories数据集构建,专门设计用于支持事件驱动型反应式模型的第二阶段训练。其核心研究问题聚焦于如何通过简化的交互格式([Q]用户查询[A]模型回答)优化模型的短时记忆处理能力,而非依赖传统语言模型的全历史处理方式。作为面向微小型研究模型的专用数据集,其合成特性与精简结构为反应式Transformer架构的探索提供了重要基础。
当前挑战
该数据集面临的主要挑战体现在两个维度:领域问题层面,需解决反应式模型在短时记忆交互格式下的序列生成准确性难题,同时避免传统LLM训练中冗余历史处理带来的计算开销;构建过程层面,生成式模型Qwen3-4b存在名称重复偏差,需通过后处理替换高频名称以增强数据多样性,且批量生成时易出现主题相似性聚集现象,需通过训练时数据洗牌缓解。此外,256 tokens的严格长度限制虽适配微型模型,但制约了复杂交互场景的覆盖能力。
常用场景
经典使用场景
在自然语言处理领域,TinyStories-Plus-Interaction-SFT数据集为研究反应式Transformer架构提供了关键支持。该数据集通过精心设计的交互式问答对,模拟了对话场景中的单序列处理,特别适用于微调小型语言模型。其简洁的格式和合成性质使其成为探索反应式模型短期记忆机制的理想实验平台,为后续更复杂的对话系统研究奠定了基础。
解决学术问题
该数据集有效解决了反应式Transformer架构在微调阶段缺乏合适数据的问题。传统语言模型需要处理完整对话历史,而反应式模型则将历史信息存储在短期记忆中,仅处理当前交互。TinyStories-Plus-Interaction-SFT提供了标准化的[Q]和[A]格式数据,帮助模型学习正确的交互模式,填补了该研究领域的数据空白,推动了反应式模型的理论发展。
实际应用
虽然该数据集主要面向研究用途,但其构建方法为开发轻量级对话系统提供了重要参考。在教育科技领域,类似的数据结构可用于构建儿童故事问答系统;在智能客服场景中,这种单序列处理模式能有效降低计算开销。数据集采用的名称多样化处理策略也为避免模型偏见提供了实用解决方案。
数据集最近研究
最新研究方向
在自然语言处理领域,TinyStories-Plus-Interaction-SFT数据集作为专为反应式Transformer架构设计的监督微调数据集,近期研究聚焦于其在小规模模型训练中的应用潜力。该数据集通过合成生成的方式,优化了交互式问答格式,为短时记忆驱动的反应式模型提供了高质量的微调样本。前沿研究探索了其在事件驱动模型中的表现,特别是在处理单序列交互时的效率与准确性。此外,数据集通过名称多样化的后处理,显著降低了模型对特定名称的过拟合风险,为小规模语言模型的鲁棒性研究提供了新的实验平台。这一方向与当前轻量化、高效能模型的研究趋势高度契合,为资源受限环境下的对话系统开发提供了重要参考。
以上内容由遇见数据集搜集并总结生成



