five

endomorphosis/Caselaw_Access_Project_JSON

收藏
Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/endomorphosis/Caselaw_Access_Project_JSON
下载链接
链接失效反馈
官方服务:
资源简介:
Caselaw Access Project数据集是由哈佛法学院图书馆与Ravel Law合作数字化的,包含了超过40百万的美国法院判决,涵盖了360年的历史。该数据集经过Teraflop AI的后处理,修复了OCR错误,并进行了编码、规范化、重复、冗余、解析和格式化的处理。数据集适用于文本生成任务,主要涉及法律领域,语言为英语。

Caselaw Access Project数据集是由哈佛法学院图书馆与Ravel Law合作数字化的,包含了超过40百万的美国法院判决,涵盖了360年的历史。该数据集经过Teraflop AI的后处理,修复了OCR错误,并进行了编码、规范化、重复、冗余、解析和格式化的处理。数据集适用于文本生成任务,主要涉及法律领域,语言为英语。
提供机构:
endomorphosis
原始信息汇总

Caselaw Access Project 数据集概述

基本信息

  • 许可证: CC0-1.0
  • 任务类别: 文本生成
  • 语言: 英语
  • 标签: 法律、法律、案例法
  • 美观名称: Caselaw Access Project
  • 数据集大小: 1M<n<10M

数据集描述

Caselaw Access Project 是由哈佛法律图书馆与Ravel Law合作,数字化了超过4000万份美国法院判决,包括过去360年间的670万件案件。该数据集广泛可用于各种用途,并可通过Caselaw Access Project API (CAPAPI) 进行批量下载。

数据处理

Teraflop AI 对原始CAP数据进行了处理和清理,修复了OCR错误,包括编码、规范化、重复、冗余、解析和格式化问题。该公司的数据引擎支持大规模并行处理,能够将网络规模的数据集转换为清洁文本形式。

许可证信息

Caselaw Access Project 数据集根据CC0许可证发布,允许公众自由使用。

引用信息

  • 作者: The President and Fellows of Harvard University
  • 标题: Caselaw Access Project
  • 年份: 2024
  • 出版方式: https://case.law/
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作