five

azuki-digital/ft-llm-2026-synthetic-ja-math-qwen-235b-v2

收藏
Hugging Face2026-02-15 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/azuki-digital/ft-llm-2026-synthetic-ja-math-qwen-235b-v2
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja license: apache-2.0 task_categories: - text-generation tags: - math - synthetic - chain-of-thought - majority-vote size_categories: - 1M<n<10M configs: - config_name: original data_files: - split: train path: original/train-*.parquet - config_name: cot_4 data_files: - split: train path: cot_4/train-*.parquet - config_name: cot_8 data_files: - split: train path: cot_8/train-*.parquet - config_name: cot_12 data_files: - split: train path: cot_12/train-*.parquet - config_name: cot_16 data_files: - split: train path: cot_16/train-*.parquet - config_name: cot_20 data_files: - split: train path: cot_20/train-*.parquet --- # ft-llm-2026-synthetic-ja-math-qwen-235b-v2 日本語の数学問題に対する合成データセットです。Qwen3-235B-A22B-Instruct-2507 を用いて生成された Chain-of-Thought (CoT) 推論を含みます。多数決投票 (Majority Vote) による正解フィルタリング済みデータです。 ## サブセット | サブセット | 説明 | 件数 | |-----------|------|------| | `original` | 元のシード問題と1回のCoT生成 | 49,971 | | `cot_4` | 各問題に対して最大4回のCoT生成 | 199,884 | | `cot_8` | 各問題に対して最大8回のCoT生成 | 399,768 | | `cot_12` | 各問題に対して最大12回のCoT生成 | 599,652 | | `cot_16` | 各問題に対して最大16回のCoT生成 | 799,536 | | `cot_20` | 各問題に対して最大20回のCoT生成 | 974,555 | ## カラム | カラム名 | 説明 | |---------|------| | `category` | 数学のカテゴリ (例: 中1, IA, IIB, IIIC) | | `unit` | 単元名 (例: 一次方程式, 2次関数) | | `difficulty` | 難易度 (easy, medium, hard) | | `problem` | 数学の問題文 | | `solution` | 正解 | | `chain_of_thought` | 思考過程を含む詳細な解答 | | `models` | 生成に使用したモデル名 | ## データ統計 (`original` サブセット) 合計: **49,971** 件 ### Difficulty別件数 | Difficulty | 件数 | |-----------|------| | easy | 15,218 | | hard | 19,417 | | medium | 15,336 | ### Category別件数 | Category | 件数 | |----------|------| | 中1 | 9,155 | | 中2 | 8,433 | | 中3 | 6,908 | | IA | 7,631 | | IIB | 11,529 | | IIIC | 6,315 | ### Category × Unit 詳細 **中1** | Unit | 件数 | |------|------| | 一次方程式 | 2,667 | | 文字式 | 2,545 | | 正負の数 | 1,631 | | 比例反比例 | 2,312 | **中2** | Unit | 件数 | |------|------| | 一次関数 | 2,597 | | 文字式 | 2,519 | | 確率 | 1,219 | | 連立方程式 | 2,098 | **中3** | Unit | 件数 | |------|------| | 二次方程式 | 1,618 | | 二次関数 | 1,803 | | 展開と因数分解 | 1,938 | | 平方根 | 1,549 | **IA** | Unit | 件数 | |------|------| | 2次関数 | 1,898 | | 場合の数と確率 | 2,124 | | 数と式 | 1,934 | | 整数の性質(数学と人間活動) | 1,675 | **IIB** | Unit | 件数 | |------|------| | いろいろな式 | 1,310 | | 三角関数 | 1,862 | | 微分法・積分法 | 1,403 | | 指数・対数 | 2,250 | | 数列 | 2,088 | | 統計的な推測 | 2,616 | **IIIC** | Unit | 件数 | |------|------| | ベクトル | 992 | | 平面上の曲線と複素数平面 | 1,245 | | 微分 | 1,385 | | 極限 | 1,446 | | 積分 | 1,247 |
提供机构:
azuki-digital
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作