azuki-digital/ft-llm-2026-synthetic-ja-math-qwen-235b-v2
收藏Hugging Face2026-02-15 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/azuki-digital/ft-llm-2026-synthetic-ja-math-qwen-235b-v2
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- ja
license: apache-2.0
task_categories:
- text-generation
tags:
- math
- synthetic
- chain-of-thought
- majority-vote
size_categories:
- 1M<n<10M
configs:
- config_name: original
data_files:
- split: train
path: original/train-*.parquet
- config_name: cot_4
data_files:
- split: train
path: cot_4/train-*.parquet
- config_name: cot_8
data_files:
- split: train
path: cot_8/train-*.parquet
- config_name: cot_12
data_files:
- split: train
path: cot_12/train-*.parquet
- config_name: cot_16
data_files:
- split: train
path: cot_16/train-*.parquet
- config_name: cot_20
data_files:
- split: train
path: cot_20/train-*.parquet
---
# ft-llm-2026-synthetic-ja-math-qwen-235b-v2
日本語の数学問題に対する合成データセットです。Qwen3-235B-A22B-Instruct-2507 を用いて生成された Chain-of-Thought (CoT) 推論を含みます。多数決投票 (Majority Vote) による正解フィルタリング済みデータです。
## サブセット
| サブセット | 説明 | 件数 |
|-----------|------|------|
| `original` | 元のシード問題と1回のCoT生成 | 49,971 |
| `cot_4` | 各問題に対して最大4回のCoT生成 | 199,884 |
| `cot_8` | 各問題に対して最大8回のCoT生成 | 399,768 |
| `cot_12` | 各問題に対して最大12回のCoT生成 | 599,652 |
| `cot_16` | 各問題に対して最大16回のCoT生成 | 799,536 |
| `cot_20` | 各問題に対して最大20回のCoT生成 | 974,555 |
## カラム
| カラム名 | 説明 |
|---------|------|
| `category` | 数学のカテゴリ (例: 中1, IA, IIB, IIIC) |
| `unit` | 単元名 (例: 一次方程式, 2次関数) |
| `difficulty` | 難易度 (easy, medium, hard) |
| `problem` | 数学の問題文 |
| `solution` | 正解 |
| `chain_of_thought` | 思考過程を含む詳細な解答 |
| `models` | 生成に使用したモデル名 |
## データ統計 (`original` サブセット)
合計: **49,971** 件
### Difficulty別件数
| Difficulty | 件数 |
|-----------|------|
| easy | 15,218 |
| hard | 19,417 |
| medium | 15,336 |
### Category別件数
| Category | 件数 |
|----------|------|
| 中1 | 9,155 |
| 中2 | 8,433 |
| 中3 | 6,908 |
| IA | 7,631 |
| IIB | 11,529 |
| IIIC | 6,315 |
### Category × Unit 詳細
**中1**
| Unit | 件数 |
|------|------|
| 一次方程式 | 2,667 |
| 文字式 | 2,545 |
| 正負の数 | 1,631 |
| 比例反比例 | 2,312 |
**中2**
| Unit | 件数 |
|------|------|
| 一次関数 | 2,597 |
| 文字式 | 2,519 |
| 確率 | 1,219 |
| 連立方程式 | 2,098 |
**中3**
| Unit | 件数 |
|------|------|
| 二次方程式 | 1,618 |
| 二次関数 | 1,803 |
| 展開と因数分解 | 1,938 |
| 平方根 | 1,549 |
**IA**
| Unit | 件数 |
|------|------|
| 2次関数 | 1,898 |
| 場合の数と確率 | 2,124 |
| 数と式 | 1,934 |
| 整数の性質(数学と人間活動) | 1,675 |
**IIB**
| Unit | 件数 |
|------|------|
| いろいろな式 | 1,310 |
| 三角関数 | 1,862 |
| 微分法・積分法 | 1,403 |
| 指数・対数 | 2,250 |
| 数列 | 2,088 |
| 統計的な推測 | 2,616 |
**IIIC**
| Unit | 件数 |
|------|------|
| ベクトル | 992 |
| 平面上の曲線と複素数平面 | 1,245 |
| 微分 | 1,385 |
| 極限 | 1,446 |
| 積分 | 1,247 |
提供机构:
azuki-digital



