tinygsm_fopython_no_obs_depth1to9_traindepth5
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/rosieyzh/tinygsm_fopython_no_obs_depth1to9_traindepth5
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多轮对话或问题解答场景的结构化记录,主要特征包括:问题唯一标识(question_hash)、计算深度(computation_depth)、赋值操作次数(num_assignments)、原始轨迹长度(primitive_trace_len)、最终答案(answer)、对话轮次(num_turns)以及完整的对话文本(turns/text)。数据集划分为训练集(6,841,488条)、测试集(760,686条)和OOD测试集(263,037条)三部分,总大小约12.5GB。每个样本包含从问题标识到最终答案的完整交互链条,适用于对话系统训练、问答模型评估等NLP任务,特别包含专门测试分布外泛化能力的独立测试集(test_ood)。
创建时间:
2026-03-16



