five

AcroYAMALEX/acro-yamalex-llmjp-4-math-cot

收藏
Hugging Face2026-04-06 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/AcroYAMALEX/acro-yamalex-llmjp-4-math-cot
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja license: mit task_categories: - text-generation tags: - math - chain-of-thought - reasoning - japanese - sft size_categories: - 100K<n<1M --- # acro-yamalex-llmjp-4-math-cot(データセット) 日本語数学推論のためのChain-of-Thought (CoT) データセットです。 [StackMathQA](https://huggingface.co/datasets/math-ai/StackMathQA)の問題に対して、DeepSeek V3を用いて日本語CoT形式の解法を生成しました。 本データセットは[FT-LLM2026コンペティション](https://llm-jp.github.io/tuning-competition/)における我々のアプローチの一部として構築されました。 ## データセット概要 | 項目 | 値 | |---|---| | データ件数 | 306,366件 | | 言語 | 日本語 | | ソース | [StackMathQA](https://huggingface.co/datasets/math-ai/StackMathQA) | | 生成モデル | DeepSeek V3 (deepseek-chat) | | フォーマット | JSONL(マルチターン対話形式) | ## データ作成手法 [OpenMathReasoning](https://arxiv.org/abs/2504.16891)(NVIDIAのAIMO-2優勝手法)の枠組みに基づき、以下の手順で作成しました。 ### Step 1: 日本語CoT解法の生成 StackMathQAの問題に対してDeepSeek V3を用い、日本語で思考過程(`<think>`タグ内)と最終回答(`\boxed{}`形式)を含む解法を生成しました。プロンプトで日本語での出力を指示することで、翻訳と解法生成を同時に行っています。 ### Step 2: 回答の検証 生成された解法から`\boxed{}`内の回答を抽出し、元データの正解と照合しました。照合は以下の3段階で実施し、いずれかで一致したデータのみを採用しています。 1. **文字列一致**: 回答文字列の完全一致 2. **数値比較**: 許容誤差 10⁻⁶ での数値比較 3. **LLMジャッジ**: LLMによる等価性判定 ### Step 3: 学習形式への変換 検証に通過したデータを、system/user/assistantの3ターン対話形式に変換しました。 ## データフォーマット 各行は以下のJSON構造を持つJSONLファイルです。 ```json { "messages": [ { "role": "system", "content": "あなたは熟練した数学の専門家であり、注意深い問題解決者です。..." }, { "role": "user", "content": "なぜ球の体積は 4/3 π r^3 なのですか?" }, { "role": "assistant", "content": "<think>\nユーザーは球の体積公式に現れる4/3がどこから来るのか不思議に思っているようだ...\n</think>\n球の体積の公式における 4/3 は、積分や幾何学的な比較から自然に導かれます...\n\n$$\\boxed{\\frac{4}{3}\\pi r^3}$$" } ] } ``` ### フィールド説明 | フィールド | 説明 | |---|---| | `messages[0]` (system) | 数学の専門家としての役割を指定するシステムプロンプト | | `messages[1]` (user) | 数学の問題文 | | `messages[2]` (assistant) | `<think>`タグで囲まれた思考過程と`\boxed{}`形式の最終回答を含む解法 | ## 用途 - 日本語数学推論モデルのSFT(教師あり微調整) - Chain-of-Thought推論の学習 ## 関連リソース | リソース | リンク | |---|---| | CoTモデル | [AcroYAMALEX/acro-yamalex-llmjp-4-math-cot](https://huggingface.co/AcroYAMALEX/acro-yamalex-llmjp-4-math-cot) | | TIRデータセット | [AcroYAMALEX/acro-yamalex-llmjp-4-math-tir](https://huggingface.co/datasets/AcroYAMALEX/acro-yamalex-llmjp-4-math-tir) | | TIRモデル | [AcroYAMALEX/acro-yamalex-llmjp-4-math-tir](https://huggingface.co/AcroYAMALEX/acro-yamalex-llmjp-4-math-tir) | | 論文 | NLP2026にて発表予定 | ## 参考文献 - Ivan Moshkov et al. "AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset." arXiv:2504.16891, 2025. - Ting Zhang et al. "StackMathQA: A Curated Collection of 2 Million Mathematical Questions and Answers Sourced from Stack Exchange." 2024. - DeepSeek-AI. "DeepSeek-V3 Technical Report." arXiv:2412.19437, 2024. ## 著者 佐々木峻・山本大輝・樋口慎・吉岡駿(アクロクエストテクノロジー株式会社) ## ライセンス MIT License
提供机构:
AcroYAMALEX
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作