five

SVAMP_de

收藏
Hugging Face2025-12-07 更新2025-12-08 收录
下载链接:
https://huggingface.co/datasets/tabularisai/SVAMP_de
下载链接
链接失效反馈
官方服务:
资源简介:
SVAMP_de是一个高质量的德语翻译数学数据集,源自SVAMP数据集。它通过先进的LLM技术和严格的验证流程(包括翻译、验证、纠正和结果确认)确保所有数字和变量与英文原版完全一致。数据集专门针对数学应用题,强调在翻译过程中保持数学逻辑和特定数字不变。数据集结构在原始基础上增加了德语字段,如Body_DE、Question_DE和question_concat_DE。

SVAMP_de is a high-quality German-translated mathematical dataset derived from the original SVAMP dataset. It leverages state-of-the-art LLM technologies and a rigorous validation workflow encompassing translation, verification, correction and result confirmation to guarantee full consistency between all numbers and variables and the original English version. This dataset is specifically tailored for mathematical word problems, with a core emphasis on preserving mathematical logic and specific numerical values throughout the translation process. Its structure retains the original framework while adding dedicated German-language fields including Body_DE, Question_DE and question_concat_DE.
创建时间:
2025-12-07
原始信息汇总

SVAMP_de数据集概述

数据集基本信息

  • 名称: SVAMP_de
  • 语言: 德语、英语
  • 许可证: MIT
  • 任务类别: 文本生成、问答
  • 标签: 数学、应用题、翻译、SVAMP
  • 源数据集: ChilleD/SVAMP

数据集描述

SVAMP_de是SVAMP数据集的高质量德语翻译版本。该数据集采用严格的验证流程和最先进的LLM,确保了100%的数值一致性和逻辑保真度。

创建方法

数据生成采用“严格逻辑”流程:

  1. 翻译: 使用最先进的LLM进行翻译。
  2. 验证: 通过程序检查每一行数据,确保所有数字与原始英文源数据匹配。
  3. 修正: 对未通过验证的数据行,使用更严格的提示词重试或手动修补。
  4. 结果: 在数字和变量上实现了100%的验证通过率。

翻译提示词旨在将语言翻译与数学逻辑解耦,明确指示模型将数字和逻辑视为不可变的“常量”,以防止LLM在翻译过程中尝试“解答”或“本地化”数学问题。

数据结构

与原始数据集结构相同,并增加了德语字段:

  • Body_DE: 德语正文
  • Question_DE: 德语问题
  • question_concat_DE: 拼接的德语文本

引用信息

bib @misc{vadim_borisov_2025, author = { Vadim Borisov and Richard H. Schreiber }, title = { SVAMP_de (Revision f2bb56b) }, year = 2025, url = { https://huggingface.co/datasets/tabularisai/SVAMP_de }, doi = { 10.57967/hf/7178 }, publisher = { Hugging Face } }

搜集汇总
数据集介绍
main_image_url
构建方式
在数学应用题领域,跨语言迁移常面临数值失真与逻辑扭曲的挑战。SVAMP_de数据集的构建采用了一套严谨的“严格逻辑”流程:首先借助前沿大语言模型进行初始翻译,随后通过程序化验证确保每一行数据中的数字与变量均与英文原版完全一致。对于验证未通过的部分,研究团队采用更严格的提示词进行重译或进行人工修正,最终实现了数值与逻辑的100%验证通过率,从而保障了翻译过程在语言转换的同时,完整保留了原问题的数学结构。
特点
该数据集的核心特征在于其卓越的数值一致性与逻辑保真度。与常规翻译可能产生数字幻觉或单位混淆不同,SVAMP_de通过特定的提示词设计,明确指令模型将数学逻辑与具体数字视为不可变常量进行翻译,有效避免了模型在翻译过程中擅自进行单位换算或尝试解题。数据集在保留原始SVAMP结构的基础上,新增了德语的问题正文、提问及拼接文本字段,为德语数学推理模型的训练与评估提供了高质量、可直接对齐的基准资源。
使用方法
该数据集适用于文本生成与问答任务,主要用于训练或评估模型在德语语境下的数学推理能力。使用者可直接加载`Body_DE`与`Question_DE`字段作为输入,其对应的答案与原始英文版本保持一致,确保了评估标准的统一。研究人员可将其用于多语言数学模型的对比分析,或作为德语数学应用题求解系统的基准测试集,其严谨的构建方法为跨语言数学推理研究提供了可靠的实验数据基础。
背景与挑战
背景概述
数学应用题求解是自然语言处理领域的一项关键任务,旨在评估模型对文本中隐含数学逻辑的理解与推理能力。SVAMP_de数据集作为SVAMP(Simple Varied Arithmetic Math Problems)的德语翻译版本,由Vadim Borisov与Richard H. Schreiber于2025年发布,依托于高质量的翻译流程与严格的验证机制。该数据集的核心研究问题聚焦于跨语言数学推理,通过将英语数学应用题精准转化为德语,为德语自然语言处理模型提供了标准化的评估基准,对推动多语言数学问题求解研究具有显著影响力。
当前挑战
数学应用题翻译面临的核心挑战在于保持数值与逻辑的绝对一致性,传统翻译方法常因语言转换导致数字幻觉或单位扭曲,从而破坏问题原有的数学结构。SVAMP_de在构建过程中,通过设计“严格逻辑”流程应对此类挑战:首先,采用先进大语言模型进行翻译,并明确指令将数字与逻辑视为不可变常量;其次,实施程序化验证,确保每一行数据的数值与原始英语源完全匹配;最后,对未通过验证的样本进行重试或手动修正,以实现100%的数值验证通过率,从而解决了跨语言数学数据保真度的难题。
常用场景
经典使用场景
在数学推理与自然语言处理交叉领域,SVAMP_de数据集为研究者提供了高质量的德语数学应用题资源。该数据集常用于评估和训练语言模型在德语语境下的数学问题求解能力,特别是针对需要精确数字和逻辑推理的文本生成任务。通过提供严格验证的翻译版本,它支持跨语言数学推理研究,使得模型能够在保持数学逻辑一致性的前提下,处理不同语言的输入。
解决学术问题
SVAMP_de解决了数学应用题翻译中常见的数字幻觉和逻辑失真问题,为跨语言数学推理研究提供了可靠基准。它确保了翻译过程中的数值一致性和逻辑保真度,使研究者能够专注于语言模型在德语中的数学理解能力,而非翻译误差。这一数据集推动了多语言数学问题求解领域的发展,为评估模型在非英语语境下的泛化性能提供了标准化工具。
衍生相关工作
基于SVAMP_de,研究者已开展多项经典工作,包括开发针对德语数学问题的专用语言模型,以及探索跨语言迁移学习在数学推理任务中的应用。这些工作扩展了多语言数学数据集的构建方法,并促进了严格逻辑验证流程的标准化。相关研究还推动了数学应用题生成和评估框架的改进,为后续多语言数学推理数据集提供了参考范例。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作