rcds/swiss_citation_extraction
收藏Hugging Face2023-08-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rcds/swiss_citation_extraction
下载链接
链接失效反馈官方服务:
资源简介:
Swiss Citation Extraction是一个多语言、历时性的数据集,包含131K瑞士联邦最高法院(FSCS)案例。该数据集用于具有挑战性的标记分类任务。数据集支持德语、法语和意大利语,数据来源于瑞士联邦最高法院发布的未处理格式(HTML)文件,这些文件从Entscheidsuche门户下载。数据集中的个人或敏感信息在发布前已根据法院的匿名化规则进行了匿名化处理。数据集发布在CC-BY-4.0许可下,符合法院的许可要求。
提供机构:
rcds
原始信息汇总
数据集概述
数据集名称
- Swiss Citation Extraction
数据集摘要
- Swiss Citation Extraction 是一个多语言、历时性的数据集,包含131K个瑞士联邦最高法院(FSCS)案例。该数据集属于一个具有挑战性的令牌分类任务。
支持的任务和排行榜
- 该数据集支持的任务未详细说明。
语言
- 数据集包含三种语言:德语(de,85K文档)、法语(fr,38K文档)和意大利语(it,8K文档)。
数据集结构
- 数据实例:详细信息未提供。
- 数据字段:
- decision_id
- considerations
- NER_labels:包括CITATION、LAW和O标签,遵循IOB格式。
- law_area (字符串)
- language (字符串)
- year (整数)
- chamber (字符串)
- region (字符串)
- 数据分割:详细信息未提供。
数据集创建
- 来源数据:数据来源于瑞士联邦最高法院(https://www.bger.ch),原始数据为HTML格式。
- 注释:元数据由瑞士联邦最高法院发布。
- 个人和敏感信息:数据集中的个人或敏感信息已根据法院指南进行匿名化处理。
使用数据的考虑
- 社会影响、偏见讨论和其他已知限制:详细信息未提供。
附加信息
- 许可证信息:数据集根据CC-BY-4.0许可证发布。
- 引用信息:请引用ArXiv预印本(https://arxiv.org/abs/2306.09237)。
- 数据集管理员:详细信息未提供。



