five

chengshuaizhao/DataAlchemy

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/chengshuaizhao/DataAlchemy
下载链接
链接失效反馈
官方服务:
资源简介:
DataAlchemy是一个用于可控研究大型语言模型(LLMs)中链式思维(CoT)推理的符号数据集。每条记录将一个提示与逐步推理轨迹和最终答案配对,生成于DataAlchemy框架下。数据集包含多种基础变换组合和不同的推理深度,能够系统性地探究当测试分布偏离训练分布时CoT行为的变化。数据集旨在用于任务泛化和推理深度泛化等研究。

DataAlchemy is a symbolic dataset for the controlled study of Chain-of-Thought (CoT) reasoning in Large Language Models (LLMs). Each record pairs a prompt with a step-by-step reasoning trace and a final answer, produced under the DataAlchemy framework. The files span multiple compositions of base transformations at varying reasoning depths, enabling systematic probes of how CoT behavior shifts as the test distribution drifts from the training distribution. The dataset is intended for tasks like task generalization and reasoning-depth generalization.
提供机构:
chengshuaizhao
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作