five

reasoning-degeneration-dev/TIW-Qwen3-4B-Thinking-2507-cd5arg-budget_forcing

收藏
Hugging Face2025-12-19 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/reasoning-degeneration-dev/TIW-Qwen3-4B-Thinking-2507-cd5arg-budget_forcing
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于倒计时推理任务的数据集,使用了budget_forcing策略,目标token数为4096。数据集包含100行和13列,涵盖了问题陈述、元数据、任务类型标识符、初始提示消息、模型响应、token计数、轮次计数、继续提示、继续文本、策略类型、答案提取、正确性评估和评估细节等信息。

This is a dataset for countdown reasoning tasks using the budget_forcing strategy with a target of 4096 tokens. The dataset contains 100 rows and 13 columns, covering question statements, metadata, task type identifiers, initial prompt messages, model responses, token counts, round counts, continuation prompts, continuation text, strategy types, answer extraction, correctness evaluations, and evaluation details.
提供机构:
reasoning-degeneration-dev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作