refugee-law-lab/canadian-legal-data
收藏Hugging Face2025-08-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/refugee-law-lab/canadian-legal-data
下载链接
链接失效反馈官方服务:
资源简介:
Refugee Law Lab: Canadian Legal Data数据集包含加拿大联邦层面的法律、法规以及数千个法院和法庭裁决的非官方文本。该数据集旨在支持法律分析(例如识别法律决策中的模式)、测试机器学习和自然语言处理工具在加拿大双语法律材料上的应用,以及为各种任务预训练语言模型。数据集结构包括多个配置,每个配置对应不同类型的法律文件,如最高法院裁决、联邦法院裁决、税务法院裁决等。数据字段包括引用、年份、名称、语言、文档日期等。数据集创建的目的是为了促进研究和倡导,避免商业行为对法律数据的垄断。使用该数据集时需注意隐私保护和数据偏见问题。
Refugee Law Lab: Canadian Legal Data数据集包含加拿大联邦层面的法律、法规以及数千个法院和法庭裁决的非官方文本。该数据集旨在支持法律分析(例如识别法律决策中的模式)、测试机器学习和自然语言处理工具在加拿大双语法律材料上的应用,以及为各种任务预训练语言模型。数据集结构包括多个配置,每个配置对应不同类型的法律文件,如最高法院裁决、联邦法院裁决、税务法院裁决等。数据字段包括引用、年份、名称、语言、文档日期等。数据集创建的目的是为了促进研究和倡导,避免商业行为对法律数据的垄断。使用该数据集时需注意隐私保护和数据偏见问题。
提供机构:
refugee-law-lab
原始信息汇总
数据集概述
数据集名称
- 名称: Refugee Law Lab: Canadian Legal Data
数据集内容
- 类型: 包括加拿大联邦级别的立法、法规、法院和法庭裁决的非官方文本。
- 用途: 用于法律分析(如识别法律决策模式)、测试ML和NLP工具、预训练语言模型等。
数据集结构
- 数据实例: 包括法院裁决、法庭裁决、立法和法规。
- 数据字段: 包括引用(citation)、文档名称(name)、语言(language)、文档日期(document_date)等。
- 数据语言: 多数文档提供英语和法语版本。
数据集配置
- 配置名称: 包括default、SCC、FCA、FC、TCC等。
- 数据文件路径: 每个配置对应不同的数据文件路径,如SCC/.parquet、FCA/.parquet等。
数据集大小
- 大小: 100K<n<1M
数据集许可证
- 许可证: Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
数据集使用注意事项
- 隐私和敏感信息: 文档可能包含个人和敏感信息,用户需遵守相关隐私保护规定。
- 非官方版本: 数据集中的文档为非官方版本,官方版本请参考源URL。
- 社会影响: 使用此数据集需考虑其对隐私保护、政府透明度、信息不对称等方面的影响。
数据集创建和维护
- 维护者: Sean Rehaag, Osgoode Hall Law School Professor & Director of the Refugee Law Lab
- 支持机构: 社会科学与人文研究委员会、安大略省法律基金会
数据集引用信息
- 引用格式: Sean Rehaag, "Refugee Law Lab: Canadian Legal Data" (2023) online: Hugging Face: https://huggingface.co/datasets/refugee-law-lab/canadian-legal-data (updated 2024).



