LexNum

Name: LexNum
Creator: 中国人民大学高薪人工智能学院, 国际商务与经济大学
Published: 2025-04-03 21:54:53
License: 暂无描述

arXiv2025-04-03 更新2025-04-08 收录

下载链接：

http://arxiv.org/abs/2504.02590v1

下载链接

链接失效反馈

官方服务：

资源简介：

LexNum是首个专门为中文法律场景中的数学推理任务设计的法律数据集，由中国人民大学高薪人工智能学院和国际商务与经济大学构建。该数据集覆盖了三种高频诉讼场景：经济补偿、工伤赔偿和交通事故赔偿。数据来源于pkulaw网站，通过LLM模型提取与法律数学推理相关的内容，并经过人类专家的双重验证以保证数据质量。该数据集旨在为法律场景中的LLM推理研究提供支持。

LexNum is the first specialized legal dataset designed for mathematical reasoning tasks in Chinese legal scenarios, jointly constructed by the Gaoling School of Artificial Intelligence at Renmin University of China and the University of International Business and Economics. The dataset covers three high-frequency litigation scenarios: economic compensation, work-related injury compensation, and traffic accident compensation. Its data is sourced from the PKULAW website, where content related to legal mathematical reasoning is extracted via large language models (LLMs), and the data quality is ensured through double verification by human experts. This dataset aims to support research on LLM-based reasoning in legal scenarios.

提供机构：

中国人民大学高薪人工智能学院, 国际商务与经济大学

创建时间：

2025-04-03

搜集汇总

数据集介绍

构建方式

LexNum数据集的构建过程体现了严谨的法律与计算思维融合。研究团队从pkulaw平台采集了经济补偿、工伤赔偿和交通事故赔偿三大类诉讼场景的原始案例，通过GPT-4o进行法律数学推理相关内容的初步提取，包括问题描述、答案及分散在文本中的推理逻辑。为确保数据质量，采用LLM初筛与人工校验的双重机制，特别针对问题完整性进行验证，最终构建出首个中文法律数学推理基准数据集。

特点

该数据集具有鲜明的领域专业性和计算复杂性特征。涵盖的三大场景均需同时满足法律条款合规性与数学计算精确性，如经济补偿需准确核算月数上限，工伤赔偿要求区分法定赔偿项目，交通事故赔偿涉及多险种叠加计算。每个案例包含完整的赔偿要素输入和标准化输出，且推理过程严格遵循《劳动合同法》《工伤保险条例》等法律程序，为模型训练提供了兼具法律逻辑与数学严谨性的高质量样本。

使用方法

LexNum支持端到端的法律数学推理能力评估与提升。使用时需将案例输入模型，要求其按照‘<think>推理步骤</think> boxed最终结果’的格式输出，重点考察模型对法律程序的遵循程度（如责任认定-保险覆盖-赔偿计算的逻辑链）和计算准确性。研究者可通过提出的LexPam强化学习框架，以正确性奖励、法律程序意识奖励和格式奖励的三元奖励机制优化模型，实验表明该方法能使1.5B小模型超越7B规模基线模型的表现。

背景与挑战

背景概述

LexNum数据集由中国人民大学高瓴人工智能学院与对外经济贸易大学的研究团队于2025年联合构建，是首个专注于中文法律数学推理的专项数据集。该数据集针对法律场景中计算可信度这一核心问题，覆盖经济补偿、工伤保险和交通事故赔偿三大高频诉讼场景，填补了法律大语言模型在数学推理能力评估与训练方面的数据空白。其创新性体现在将法律程序意识与数学计算相结合，通过从裁判文书网提取原始案例并经大模型与专家双重校验，构建了具有法律计算逻辑的推理路径，为法律智能服务的可信计算提供了基准测试平台。

当前挑战

LexNum面临的挑战主要体现在领域问题与构建过程两个维度。在领域问题方面，现有法律大模型虽擅长法律知识检索却普遍存在数值计算能力退化现象，而通用推理模型虽具数学能力但缺乏法律程序意识，导致其在责任认定、保险覆盖等法律计算环节产生逻辑偏差。构建过程中的挑战包括：法律计算路径标注需同时满足数学正确性与法律合规性双重标准，导致人工标注成本极高；不同赔偿场景的计算逻辑存在显著差异，要求数据集必须覆盖多样化的法律计算范式；此外，从非结构化裁判文书中提取计算要素时，面临信息分散与法律术语歧义等自然语言处理难题。

常用场景

经典使用场景

LexNum数据集在法学与人工智能交叉领域具有重要应用价值，尤其在法律数学推理任务中展现出独特优势。该数据集聚焦经济补偿、工伤赔偿和交通事故赔偿三大高频诉讼场景，为研究者提供了丰富的法律计算问题实例。通过精心设计的案例结构和详尽的赔偿计算过程，LexNum能够有效支持法律大语言模型在复杂赔偿计算中的推理能力验证与提升。

实际应用

在司法实务中，LexNum可直接应用于智能法律咨询系统的开发，使AI能够准确计算各类赔偿金额。例如在工伤赔偿场景，系统可依据《工伤保险条例》自动计算停工留薪期工资、伤残补助金等多项费用，生成符合法律程序的详细计算步骤，显著提升法律服务的透明度和可信度，为当事人提供专业可靠的计算依据。

衍生相关工作

基于LexNum数据集的研究催生了多项创新成果，最具代表性的是LexPam强化学习框架。该框架通过法律程序感知奖励机制，引导模型遵循法定计算流程进行推理。后续研究进一步拓展了跨领域迁移能力验证，证明经LexNum训练的模型在未接触过的法律计算场景仍保持良好表现，为领域自适应研究提供了新思路。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集