five

LevMuchnik/SupremeCourtOfIsrael

收藏
Hugging Face2023-04-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LevMuchnik/SupremeCourtOfIsrael
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集代表了2022年以色列最高法院公开判决和决定的快照,支持丰富的元数据。数据集总大小为5.31GB,包含751,194个文档,其中文本数据占2.68GB。数据集主要用于语言建模、掩码语言建模和文档检索等任务。数据集的语言主要为希伯来语,少数文档为英语。数据集的结构为JSON行文件,每行对应一个文档,包含文档标识、文本和元数据。数据集的创建日期为2023年4月22日,数据来源于以色列最高法院网站。数据集由Lev Muchnik和Inbal Yahav Shenberger等人创建,并得到了以色列创新局的支持。

该数据集代表了2022年以色列最高法院公开判决和决定的快照,支持丰富的元数据。数据集总大小为5.31GB,包含751,194个文档,其中文本数据占2.68GB。数据集主要用于语言建模、掩码语言建模和文档检索等任务。数据集的语言主要为希伯来语,少数文档为英语。数据集的结构为JSON行文件,每行对应一个文档,包含文档标识、文本和元数据。数据集的创建日期为2023年4月22日,数据来源于以色列最高法院网站。数据集由Lev Muchnik和Inbal Yahav Shenberger等人创建,并得到了以色列创新局的支持。
提供机构:
LevMuchnik
原始信息汇总

数据集概述

数据集描述

  • 名称: Supreme Court Israel - Public Verdicts and Decisions
  • 大小: 5.31GB,包含751,194个文档,总文本量为2.68GB
  • 语言: 主要为希伯来语,少数为英语
  • 许可: openrail
  • 标签: legal, verdicts, metadata, hebrew
  • 任务:
    • language-modeling
    • masked-language-modeling
    • document-retrieval
  • 任务类别:
    • text-generation
    • fill-mask
    • text-retrieval

数据集结构

  • 格式: JSON lines
  • 结构: 每行对应一个文档,包含文档标识、文本和元数据

数据字段

  • case_id: 案件编号
  • download_time: 文档下载时间
  • number_of_case_documents: 当前案件文档数量
  • file_name: 文档文件全名,包括相对路径
  • Id: 文档ID
  • CaseId: 案件ID
  • VerdictDt: 文档日期
  • CreatedDate: 文档插入数据库日期
  • CaseNum: 案件编号
  • CaseDesc: 案件唯一标识
  • Pages: 原始文档页数
  • Path: 文档相对路径
  • CaseName: 案件正式名称
  • FileName: 文档文件名,无路径
  • DocName: 文档文件名,无路径
  • Year: 文档创建年份
  • TypeCode: 文档类型枚举
  • Type: 文档类型
  • Technical: 文档是否为技术文档
  • CodeVolume: 未知
  • document_hash: 文档名的258位哈希值
  • text: 文档文本
  • html_title: 从HTML提取的文档标题
  • VerdictsDt: 判决日期
  • meta_case_nm: 案件正式名称
  • meta_sec_appeal: 上诉情况
  • meta_side_ty: 案件类型
  • meta_verdict_file_nm: 判决文件名
  • meta_judge: 案件法官名单
  • meta_mador_nm: 法院实例名称
  • meta_side_nm: 案件各方名单
  • meta_verdict_dt: 判决日期
  • meta_case_dt: 案件日期
  • meta_verdict_nbr: 判决编号
  • meta_ProgId: 创建文档的软件名称
  • meta_is_technical: 文档是否为技术文档
  • meta_judge_nm_last: 法官姓氏
  • meta_case_nbr: 案件正式编号
  • meta_verdict_ty: 判决类型
  • meta_lawyer_nm: 律师名单
  • meta_judge_nm_first: 法官名字
  • meta_verdict_pages: 文档页数
  • meta_inyan_nm: 法院名称
  • meta_court_nm: 法院名称

数据集创建

  • 日期: 2023-04-22
  • 来源: 以色列最高法院网站
  • 收集方式: 网络爬虫

数据集使用注意事项

  • 数据公开性: 数据集包含公开信息
  • 社会影响: 待补充
  • 偏见讨论: 待补充
  • 其他已知限制: 待补充
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作