LevMuchnik/SupremeCourtOfIsrael
收藏Hugging Face2023-04-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LevMuchnik/SupremeCourtOfIsrael
下载链接
链接失效反馈官方服务:
资源简介:
该数据集代表了2022年以色列最高法院公开判决和决定的快照,支持丰富的元数据。数据集总大小为5.31GB,包含751,194个文档,其中文本数据占2.68GB。数据集主要用于语言建模、掩码语言建模和文档检索等任务。数据集的语言主要为希伯来语,少数文档为英语。数据集的结构为JSON行文件,每行对应一个文档,包含文档标识、文本和元数据。数据集的创建日期为2023年4月22日,数据来源于以色列最高法院网站。数据集由Lev Muchnik和Inbal Yahav Shenberger等人创建,并得到了以色列创新局的支持。
该数据集代表了2022年以色列最高法院公开判决和决定的快照,支持丰富的元数据。数据集总大小为5.31GB,包含751,194个文档,其中文本数据占2.68GB。数据集主要用于语言建模、掩码语言建模和文档检索等任务。数据集的语言主要为希伯来语,少数文档为英语。数据集的结构为JSON行文件,每行对应一个文档,包含文档标识、文本和元数据。数据集的创建日期为2023年4月22日,数据来源于以色列最高法院网站。数据集由Lev Muchnik和Inbal Yahav Shenberger等人创建,并得到了以色列创新局的支持。
提供机构:
LevMuchnik
原始信息汇总
数据集概述
数据集描述
- 名称: Supreme Court Israel - Public Verdicts and Decisions
- 大小: 5.31GB,包含751,194个文档,总文本量为2.68GB
- 语言: 主要为希伯来语,少数为英语
- 许可: openrail
- 标签: legal, verdicts, metadata, hebrew
- 任务:
- language-modeling
- masked-language-modeling
- document-retrieval
- 任务类别:
- text-generation
- fill-mask
- text-retrieval
数据集结构
- 格式: JSON lines
- 结构: 每行对应一个文档,包含文档标识、文本和元数据
数据字段
- case_id: 案件编号
- download_time: 文档下载时间
- number_of_case_documents: 当前案件文档数量
- file_name: 文档文件全名,包括相对路径
- Id: 文档ID
- CaseId: 案件ID
- VerdictDt: 文档日期
- CreatedDate: 文档插入数据库日期
- CaseNum: 案件编号
- CaseDesc: 案件唯一标识
- Pages: 原始文档页数
- Path: 文档相对路径
- CaseName: 案件正式名称
- FileName: 文档文件名,无路径
- DocName: 文档文件名,无路径
- Year: 文档创建年份
- TypeCode: 文档类型枚举
- Type: 文档类型
- Technical: 文档是否为技术文档
- CodeVolume: 未知
- document_hash: 文档名的258位哈希值
- text: 文档文本
- html_title: 从HTML提取的文档标题
- VerdictsDt: 判决日期
- meta_case_nm: 案件正式名称
- meta_sec_appeal: 上诉情况
- meta_side_ty: 案件类型
- meta_verdict_file_nm: 判决文件名
- meta_judge: 案件法官名单
- meta_mador_nm: 法院实例名称
- meta_side_nm: 案件各方名单
- meta_verdict_dt: 判决日期
- meta_case_dt: 案件日期
- meta_verdict_nbr: 判决编号
- meta_ProgId: 创建文档的软件名称
- meta_is_technical: 文档是否为技术文档
- meta_judge_nm_last: 法官姓氏
- meta_case_nbr: 案件正式编号
- meta_verdict_ty: 判决类型
- meta_lawyer_nm: 律师名单
- meta_judge_nm_first: 法官名字
- meta_verdict_pages: 文档页数
- meta_inyan_nm: 法院名称
- meta_court_nm: 法院名称
数据集创建
- 日期: 2023-04-22
- 来源: 以色列最高法院网站
- 收集方式: 网络爬虫
数据集使用注意事项
- 数据公开性: 数据集包含公开信息
- 社会影响: 待补充
- 偏见讨论: 待补充
- 其他已知限制: 待补充



