endomorphosis/Caselaw_Access_Project_JSON
收藏Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/endomorphosis/Caselaw_Access_Project_JSON
下载链接
链接失效反馈官方服务:
资源简介:
Caselaw Access Project数据集是由哈佛法学院图书馆与Ravel Law合作数字化的,包含了超过40百万的美国法院判决,涵盖了360年的历史。该数据集经过Teraflop AI的后处理,修复了OCR错误,并进行了编码、规范化、重复、冗余、解析和格式化的处理。数据集适用于文本生成任务,主要涉及法律领域,语言为英语。
Caselaw Access Project数据集是由哈佛法学院图书馆与Ravel Law合作数字化的,包含了超过40百万的美国法院判决,涵盖了360年的历史。该数据集经过Teraflop AI的后处理,修复了OCR错误,并进行了编码、规范化、重复、冗余、解析和格式化的处理。数据集适用于文本生成任务,主要涉及法律领域,语言为英语。
提供机构:
endomorphosis
原始信息汇总
Caselaw Access Project 数据集概述
基本信息
- 许可证: CC0-1.0
- 任务类别: 文本生成
- 语言: 英语
- 标签: 法律、法律、案例法
- 美观名称: Caselaw Access Project
- 数据集大小: 1M<n<10M
数据集描述
Caselaw Access Project 是由哈佛法律图书馆与Ravel Law合作,数字化了超过4000万份美国法院判决,包括过去360年间的670万件案件。该数据集广泛可用于各种用途,并可通过Caselaw Access Project API (CAPAPI) 进行批量下载。
数据处理
Teraflop AI 对原始CAP数据进行了处理和清理,修复了OCR错误,包括编码、规范化、重复、冗余、解析和格式化问题。该公司的数据引擎支持大规模并行处理,能够将网络规模的数据集转换为清洁文本形式。
许可证信息
Caselaw Access Project 数据集根据CC0许可证发布,允许公众自由使用。
引用信息
- 作者: The President and Fellows of Harvard University
- 标题: Caselaw Access Project
- 年份: 2024
- 出版方式: https://case.law/



