five

rcds/swiss_legislation

收藏
Hugging Face2024-10-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rcds/swiss_legislation
下载链接
链接失效反馈
官方服务:
资源简介:
Swiss Legislation是一个多语言、历时性的数据集,包含36,000条瑞士法律。该数据集主要用于信息检索任务。数据集涵盖了瑞士的四种官方语言:德语、法语、意大利语和罗曼什语,以及部分英语法律。每条法律记录包含多个字段,如州、语言、标题、唯一标识符、简短描述、缩写、参考编号、是否有效、版本生效日期、家族生效日期、版本失效日期、版本发现日期、PDF链接、HTML链接、PDF内容、HTML内容、变更列表、历史记录和引用列表。数据集来源于瑞士联邦最高法院,数据以HTML格式发布,并经过匿名化处理。数据集采用CC-BY-4.0许可证发布。
提供机构:
rcds
原始信息汇总

数据集概述

数据集名称

  • Swiss Legislation

数据集摘要

  • Swiss Legislation是一个包含36,000条瑞士法律的多语言、历时性数据集,用于挑战性的信息检索任务。

支持的任务和排行榜

  • 文本分类
  • 翻译

语言

  • 德语(de)
  • 法语(fr)
  • 意大利语(it)
  • 罗曼什语(rm)
  • 英语(en)

数据集大小

  • 100,000 < n < 1,000,000

数据集结构

  • 数据实例:每个实例为一个字典,包含以下字段:
    • canton:立法来源的州
    • language:立法的语言
    • uuid:立法的唯一标识符
    • title:立法的标题
    • short:立法的简短描述
    • abbreviation:立法的缩写
    • sr_number:立法的参考编号
    • is_active:立法是否当前有效
    • version_active_since:立法当前版本生效日期
    • family_active_since:立法当前版本家族生效日期
    • version_inactive_since:立法当前版本失效日期
    • version_found_at:立法当前版本发现日期
    • pdf_url:立法的PDF链接
    • html_url:立法的HTML链接
    • pdf_content:立法的PDF内容
    • html_content:立法的HTML内容
    • changes:立法变更列表
    • history:立法历史列表
    • quotes:立法引用列表

数据集创建

  • 源数据:数据来源于瑞士联邦最高法院,原始数据为HTML格式。
  • 注释:元数据由瑞士联邦最高法院发布。
  • 个人和敏感信息:数据集中的个人或敏感信息已由法院在发布前按照特定指南进行匿名化处理。

许可证信息

  • CC-BY-SA-4.0:数据集遵循此许可证,允许内容再使用,需注明来源并标明任何更改。

引用信息

@misc{rasiah2023scale, title={SCALE: Scaling up the Complexity for Advanced Language Model Evaluation}, author={Vishvaksenan Rasiah and Ronja Stern and Veton Matoshi and Matthias Stürmer and Ilias Chalkidis and Daniel E. Ho and Joel Niklaus}, year={2023}, eprint={2306.09237}, archivePrefix={arXiv}, primaryClass={cs.CL} }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作