Dataset of Legal Documents
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Dataset_of_Legal_Documents
下载链接
链接失效反馈官方服务:
资源简介:
法律文件数据集由 2017 年和 2018 年的法院判决组成,由联邦司法和消费者保护部在线发布。这些文件来自七个联邦法院:联邦劳工法院 (BAG)、联邦财政法院 (BFH)、联邦法院 (BGH)、联邦专利法院 (BPatG)、联邦社会法院 (BSG)、联邦宪法法院 (BVerfG)和联邦行政法院 (BVerwG)。
该数据集由 66,723 个句子和 2,157,048 个标记组成。七个法院特定数据集的大小在 5,858 到 12,791 个句子之间,以及 177,835 到 404,041 个标记之间。基于每个令牌的注释分布对应于大约。 19-23%。
This legal document dataset consists of court judgments from 2017 and 2018, published online by the Federal Ministry of Justice and Consumer Protection. These documents originate from seven federal courts: the Federal Labor Court (BAG), the Federal Fiscal Court (BFH), the Federal Court of Justice (BGH), the Federal Patent Court (BPatG), the Federal Social Court (BSG), the Federal Constitutional Court (BVerfG), and the Federal Administrative Court (BVerwG).
This dataset comprises 66,723 sentences and 2,157,048 tokens. The size of each of the seven court-specific datasets ranges from 5,858 to 12,791 sentences, and from 177,835 to 404,041 tokens. The token-based annotation distribution corresponds to approximately 19% to 23%.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集由德国联邦司法机构2017-2018年的法院判决文件组成,涵盖七个联邦法院,包含约6.7万个句子和215万个标记。它主要用于命名实体识别任务,由研究机构于2020年发布。
以上内容由遇见数据集搜集并总结生成



