five

JuDDGES/en-court-raw

收藏
Hugging Face2025-04-16 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/JuDDGES/en-court-raw
下载链接
链接失效反馈
官方服务:
资源简介:
英格兰和威尔士上诉法院刑事分部判决数据集包含了从官方网站https://caselaw.nationalarchives.gov.uk/judgments/advanced_search?court=ewca/crim/ 获取的完整判决内容。该数据集包含原始数据,未进行任何标注。数据集以单语种形式提供,语言为英语。它包含了唯一的训练集划分,共有6050个例子,数据大小为164982876字节。数据集的结构包括多个字段,如判决ID、引用、案件编号、发布日期、法院类型、判决摘要、全文内容、法官信息、文件名、XML URI和原始文档URI。该数据集是为了进行跨司法辖区的法律分析而创建的。

The England and Wales Appeal Court Judgments Criminal Division dataset contains the full content of judgments from the official website at https://caselaw.nationalarchives.gov.uk/judgments/advanced_search?court=ewca/crim/. This dataset includes raw data and is monolingual, provided in English. It has a single train split with 6050 examples and a dataset size of 164982876 bytes. The structure of the dataset includes multiple fields such as judgment ID, citation, docket number, publication date, court type, judgment excerpt, full text, judges, file name, XML URI, and original document URI. The dataset was created to enable cross-jurisdictional legal analytics.
提供机构:
JuDDGES
原始信息汇总

数据集概述

数据集描述

  • 名称: England and Wales Appeal Court Judgements Criminal Division
  • 语言: 英语
  • 多语言性: 单语言
  • 数据量: 1K<n<10K
  • 来源: 原始数据
  • 标签: England and Wales court

数据结构

数据实例

数据实例包含以下字段:

  • id: 判决的唯一标识符
  • citation: 判决的引用
  • signature: 判决的签名标识符
  • date: 判决的听证日期
  • publicationDate: 判决的发布日期
  • type: 法院类型
  • excerpt: 判决头部的摘录
  • content: 判决的全文内容
  • judges: 参与判决的法官列表
  • caseNumbers: 与判决相关的案件编号列表
  • citation_references: 引用的案件参考列表
  • legislation: 引用的立法列表
  • file_name: 包含判决的文件名
  • appeal_type: 上诉类型
  • appeal_outcome: 上诉结果
  • xml_uri: XML文件的URI
  • uri: 原始文档的URI

数据字段

特征名称 特征描述 类型
_id 判决的唯一标识符 string
citation 判决的引用 string
signature 判决的签名标识符 string
date 判决的听证日期 string
publicationDate 判决的发布日期 string
type 法院类型 string
excerpt 判决头部的摘录 string
content 判决的全文内容 string
judges 参与判决的法官列表 list
caseNumbers 与判决相关的案件编号列表 list
citation_references 引用的案件参考列表 list
legislation 引用的立法列表 list
file_name 包含判决的文件名 string
appeal_type 上诉类型 string
appeal_outcome 上诉结果 string
xml_uri XML文件的URI string
uri 原始文档的URI string

数据分割

数据集仅包含一个train分割,包含6154个实例,总大小为168731254字节。

数据集创建

数据来源

数据来源于英格兰和威尔士上诉法院的判决,从官方网站https://caselaw.nationalarchives.gov.uk/judgments/advanced_search?court=ewca/crim/获取。

数据处理

  1. 下载判决的XML文件。
  2. 从XML内容中提取原始文本和判决详情。
  3. 进一步处理,准备本地数据集转储为parquet文件,使用DVC进行版本控制并推送到远程存储。

数据标注

数据集未进行标注,所有特征由judiciary.uk提供。

统计信息

数据集包含6154个实例,总大小为168731254字节。

许可信息

数据集的实际包装在Open Government Licence下许可,链接为https://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作