MultiJustice

Name: MultiJustice
Creator: Saarland University, Germany; Vrije Universiteit Amsterdam, Netherlands; Wuhan University, China; Nanyang Technical University, Singapore; University of Amsterdam, Netherlands; Eastern Institute of Technology, China
Published: 2025-07-09 22:47:00
License: 暂无描述

arXiv2025-07-09 更新2025-07-11 收录

下载链接：

https://github.com/lololo-xiao/MultiJustice-MPMCP

下载链接

链接失效反馈

官方服务：

资源简介：

MultiJustice数据集是一个针对多被告、多罪名法律预测的中文数据集，包含四个实际的法律判决场景：单一被告单一罪名、单一被告多罪名、多被告单一罪名、多被告多罪名。数据集来源于中国裁判文书网，收集了1998年至2021年的刑事案件。该数据集旨在解决多被告和多罪名情况下的法律预测问题，为智能法律助理提供决策支持。

The MultiJustice dataset is a Chinese-language dataset dedicated to multi-defendant and multiple-charge legal prediction. It includes four practical legal judgment scenarios: single defendant with single charge, single defendant with multiple charges, multiple defendants with single charge, and multiple defendants with multiple charges. The dataset is sourced from China Judgments Online, and collects criminal cases spanning from 1998 to 2021. Its purpose is to address legal prediction challenges under multi-defendant and multiple-charge circumstances, providing decision support for intelligent legal assistants.

提供机构：

Saarland University, Germany; Vrije Universiteit Amsterdam, Netherlands; Wuhan University, China; Nanyang Technical University, Singapore; University of Amsterdam, Netherlands; Eastern Institute of Technology, China

创建时间：

2025-07-09

原始信息汇总

MultiJustice: 中国多参与方多罪名法律预测数据集

数据集概述

数据集名称：MultiJustice
语言：中文
案例数量：20,000个
适用场景：4种不同法律场景

数据内容

案件事实（经过匿名化处理）
指控罪名
刑罚条款

代码资源

数据预处理脚本
模型训练与评估代码
提示模板

数据状态

完整数据集和代码将在论文终稿提交后上传。

联系方式

如有疑问请联系：xiaowang@lst.uni-saarland.de

搜集汇总

数据集介绍

构建方式

MultiJustice数据集的构建基于中国裁判文书网1998至2021年的一审刑事判决书，通过正则表达式从文书中提取案件事实、适用法律条文、指控罪名及刑罚期限等关键信息。为确保数据质量，研究团队对指控罪名进行脱敏处理，并随机抽取5%样本进行人工校验，最终形成包含20,000个合格案例的标准化数据集。数据涵盖单一被告单一指控（S1）、单一被告多重指控（S2）、多重被告单一指控（S3）及多重被告多重指控（S4）四种典型司法场景，完整保留了真实判决中被告与指控的对应关系。

特点

该数据集创新性地构建了四维度司法场景评估框架，其中S4场景的事实描述平均长度较S1增加47%，法律条文引用数量呈现显著级差。数据统计显示，多重指控案例中平均涉及2项罪名，且刑罚期限的离散程度与案件复杂度呈正相关。区别于现有单被告研究，该数据集首次系统建模了被告间量刑差异现象——89.58%的多被告案例中至少存在一项差异化判决，为法律预测模型提供了更贴近现实的评估基准。

使用方法

使用该数据集时，建议采用分层抽样策略划分训练集（4,000案例/场景）、验证集（500案例）和测试集（500案例）。对于大语言模型应用，研究证实添加BM25检索的相似案例作为提示模板示例可使InternLM2在S4场景的F1值提升12.6%。评估应同步关注指控分类（准确率、F1值）和刑期预测（LogD指标），特别注意模型在多重被告场景下的差异化判决能力。为规避数据泄露风险，须确保测试阶段不接触脱敏前的原始罪名表述。

背景与挑战

背景概述

MultiJustice数据集是由Xiao Wang、Jiahuan Pei等研究人员于2024年提出的中文法律判决预测数据集，专注于多被告、多罪名的复杂法律场景。该数据集旨在填补现有法律判决预测研究中对于多被告和多罪名案件处理的空白，通过构建包含四种实际法律判决场景（单一被告单一罪名、单一被告多罪名、多被告单一罪名、多被告多罪名）的20,000个案例，为智能法律助手的研究提供了重要资源。MultiJustice不仅推动了法律领域大语言模型的研究，也为中国刑事法律框架下的复杂案件处理提供了新的评估基准。

当前挑战

MultiJustice数据集面临的核心挑战包括：1) 领域问题方面，多被告多罪名案件的法律判决预测具有高度复杂性，案件事实描述冗长且涉及多个法律条款的交叉引用，导致模型在罪名分类和刑期预测任务上的性能显著下降；2) 数据构建过程中，需要从中国裁判文书网提取并清洗大量刑事案例，确保案件事实、法律条款、罪名和刑期等信息的准确对应，同时处理信息泄露风险和数据匿名化问题。此外，不同场景下案件数量和特征的平衡、法律术语的标准化以及模型在不同复杂度场景下的泛化能力也是构建过程中需要克服的关键挑战。

常用场景

经典使用场景

MultiJustice数据集在法学研究和自然语言处理领域中被广泛应用于法律判决预测（Legal Judgment Prediction, LJP）任务。该数据集特别针对涉及多被告和多罪名的复杂法律案件场景，为研究者提供了一个标准化的评估平台。通过模拟真实司法环境中的四种典型案件类型（单一被告单一罪名、单一被告多罪名、多被告单一罪名、多被告多罪名），MultiJustice能够有效测试模型在不同复杂度案件中的表现。数据集中的案例均来自中国裁判文书网，确保了数据的真实性和代表性，使其成为评估法律大语言模型性能的重要基准。

衍生相关工作

MultiJustice数据集已衍生出多项重要的相关研究工作。在模型架构方面，研究者基于该数据集开发了层次化Transformer模型Lawformer-XL，专门处理长文本法律文档。在方法论层面，出现了结合符号逻辑的神经模型（如MUD）和基于拓扑学习的判决预测系统（如TOPJUDGE-MP）。数据集还促进了法律解释性研究，例如《Syllogistic Reasoning for Legal Judgment Analysis》提出了三段论推理框架。这些工作不仅扩展了原始数据集的应用范围，还推动了法律人工智能在可解释性、多任务学习等方向的发展。

数据集最近研究