LennardZuendorf/legalis
收藏Hugging Face2023-10-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LennardZuendorf/legalis
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于openlegaldata.io处理的标注版本数据集,整个数据集是德语的。数据字段包括id、court、file_number、date、type、content、tenor、reasoning、facts等,并且添加了两个标注字段winner和label,这些标注是通过ChatGPT生成的,可能存在错误。数据集的语言是德语,许可证是MIT。
这是一个基于openlegaldata.io处理的标注版本数据集,整个数据集是德语的。数据字段包括id、court、file_number、date、type、content、tenor、reasoning、facts等,并且添加了两个标注字段winner和label,这些标注是通过ChatGPT生成的,可能存在错误。数据集的语言是德语,许可证是MIT。
提供机构:
LennardZuendorf
原始信息汇总
数据集概述
数据集基本信息
- 许可证: MIT
- 语言: 德语
- 标签: 法律
- 任务类别: 文本分类
- 大小类别: 1K<n<10K
数据集特征
- id: 整数类型
- file_number: 字符串类型
- date: 时间戳类型,单位为微秒
- type: 字符串类型
- content: 字符串类型
- tenor: 字符串类型
- facts: 字符串类型
- reasoning: 字符串类型
- winner: 字符串类型
- label: 整数类型
数据集拆分
- 训练集: 2660个样本,总大小为159271707.27722773字节
- 测试集: 141个样本,总大小为8442598.017326733字节
数据集大小
- 下载大小: 83977470字节
- 数据集总大小: 167714305.29455447字节
数据集字段
- id: 数字ID
- court: 作出决定的法院名称
- file_number: 案件文件编号
- date: 决定日期
- type: 案件决定类型
- content: 案件决定的完整内容
- tenor: 案件决定的法律摘要
- reasoning: 详细解释决定原因的剩余部分
- facts: 案件的详细事实和细节
- winner: 文本形式的胜方(原告或被告)
- label: 二进制标签,原告胜为1,被告胜为0
数据集编辑摘要
- 数据基于已处理的数据,由ChatGPT辅助生成标签,可能存在错误。



