top-50000/sudoku_2
收藏Hugging Face2026-02-10 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/top-50000/sudoku_2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: conversation
list:
- name: content
dtype: string
- name: role
dtype: string
- name: seed
dtype: int64
- name: task_id
dtype: int64
- name: task_metadata
struct:
- name: difficulty
dtype: string
- name: given_count
dtype: int64
- name: language
dtype: string
- name: puzzle
dtype: string
- name: seed
dtype: int64
- name: solution
dtype: string
- name: trace_id
dtype: string
- name: usage
struct:
- name: completion_tokens
dtype: int64
- name: completion_tokens_details
dtype: 'null'
- name: prompt_tokens
dtype: int64
- name: prompt_tokens_details
dtype: 'null'
- name: total_tokens
dtype: int64
- name: task_type
dtype: string
splits:
- name: train
num_bytes: 733333442
num_examples: 1000000
download_size: 82295389
dataset_size: 733333442
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称为 `conversation` 的对话列表型字段,列表内包含两个子字段:
- `content`:内容,字符串类型
- `role`:角色,字符串类型
- 名称为 `seed` 的字段,类型为 `int64`
- 名称为 `task_id` 的字段,类型为 `int64`
- 名称为 `task_metadata` 的任务元数据结构体字段,结构体包含以下子字段:
- `difficulty`:难度,字符串类型
- `given_count`:给定计数,类型为 `int64`
- `language`:语言,字符串类型
- `puzzle`:谜题,字符串类型
- `seed`:种子,类型为 `int64`
- `solution`:解决方案,字符串类型
- `trace_id`:跟踪ID,字符串类型
- `usage`:使用统计结构体,结构体包含以下子字段:
- `completion_tokens`:补全令牌 (Token),类型为 `int64`
- `completion_tokens_details`:补全令牌详情,类型为 `null`
- `prompt_tokens`:提示令牌 (Token),类型为 `int64`
- `prompt_tokens_details`:提示令牌详情,类型为 `null`
- `total_tokens`:总令牌 (Token),类型为 `int64`
- 名称为 `task_type` 的字段,类型为字符串
数据集划分:
- 划分名称为 `train`,占用字节数为733333442,样本数量为1000000
下载大小:82295389 字节
数据集总大小:733333442 字节
配置项:
- 配置名称为 `default`,数据文件配置:
- 对应划分:`train`,文件路径为 `data/train-*`
提供机构:
top-50000



