rcds/swiss_legislation
收藏Hugging Face2024-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rcds/swiss_legislation
下载链接
链接失效反馈官方服务:
资源简介:
Swiss Legislation是一个多语言、历时性的数据集,包含36,000条瑞士法律。该数据集主要用于信息检索任务。数据集涵盖了瑞士的四种官方语言:德语、法语、意大利语和罗曼什语,以及部分英语法律。每条法律记录包含多个字段,如州、语言、标题、唯一标识符、简短描述、缩写、参考编号、是否有效、版本生效日期、家族生效日期、版本失效日期、版本发现日期、PDF链接、HTML链接、PDF内容、HTML内容、变更列表、历史记录和引用列表。数据集来源于瑞士联邦最高法院,数据以HTML格式发布,并经过匿名化处理。数据集采用CC-BY-4.0许可证发布。
提供机构:
rcds
原始信息汇总
数据集概述
数据集名称
- Swiss Legislation
数据集摘要
- Swiss Legislation是一个包含36,000条瑞士法律的多语言、历时性数据集,用于挑战性的信息检索任务。
支持的任务和排行榜
- 文本分类
- 翻译
语言
- 德语(de)
- 法语(fr)
- 意大利语(it)
- 罗曼什语(rm)
- 英语(en)
数据集大小
- 100,000 < n < 1,000,000
数据集结构
- 数据实例:每个实例为一个字典,包含以下字段:
canton:立法来源的州language:立法的语言uuid:立法的唯一标识符title:立法的标题short:立法的简短描述abbreviation:立法的缩写sr_number:立法的参考编号is_active:立法是否当前有效version_active_since:立法当前版本生效日期family_active_since:立法当前版本家族生效日期version_inactive_since:立法当前版本失效日期version_found_at:立法当前版本发现日期pdf_url:立法的PDF链接html_url:立法的HTML链接pdf_content:立法的PDF内容html_content:立法的HTML内容changes:立法变更列表history:立法历史列表quotes:立法引用列表
数据集创建
- 源数据:数据来源于瑞士联邦最高法院,原始数据为HTML格式。
- 注释:元数据由瑞士联邦最高法院发布。
- 个人和敏感信息:数据集中的个人或敏感信息已由法院在发布前按照特定指南进行匿名化处理。
许可证信息
- CC-BY-SA-4.0:数据集遵循此许可证,允许内容再使用,需注明来源并标明任何更改。
引用信息
@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



