five

Dataset of Legal Documents

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Dataset_of_Legal_Documents
下载链接
链接失效反馈
官方服务:
资源简介:
法律文件数据集由 2017 年和 2018 年的法院判决组成,由联邦司法和消费者保护部在线发布。这些文件来自七个联邦法院:联邦劳工法院 (BAG)、联邦财政法院 (BFH)、联邦法院 (BGH)、联邦专利法院 (BPatG)、联邦社会法院 (BSG)、联邦宪法法院 (BVerfG)和联邦行政法院 (BVerwG)。 该数据集由 66,723 个句子和 2,157,048 个标记组成。七个法院特定数据集的大小在 5,858 到 12,791 个句子之间,以及 177,835 到 404,041 个标记之间。基于每个令牌的注释分布对应于大约。 19-23%。

This legal document dataset consists of court judgments from 2017 and 2018, published online by the Federal Ministry of Justice and Consumer Protection. These documents originate from seven federal courts: the Federal Labor Court (BAG), the Federal Fiscal Court (BFH), the Federal Court of Justice (BGH), the Federal Patent Court (BPatG), the Federal Social Court (BSG), the Federal Constitutional Court (BVerfG), and the Federal Administrative Court (BVerwG). This dataset comprises 66,723 sentences and 2,157,048 tokens. The size of each of the seven court-specific datasets ranges from 5,858 to 12,791 sentences, and from 177,835 to 404,041 tokens. The token-based annotation distribution corresponds to approximately 19% to 23%.
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由德国联邦司法机构2017-2018年的法院判决文件组成,涵盖七个联邦法院,包含约6.7万个句子和215万个标记。它主要用于命名实体识别任务,由研究机构于2020年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作