five

StanBienaives/french-open-fiscal-texts

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/StanBienaives/french-open-fiscal-texts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从法国法院Conseil dEtat的案例法中提取的,主要用于构建法律案例摘要模型。数据集包含文件的标识符、案例名称、摘要(可能缺失)和案例内容。数据集分为训练集和测试集。数据集的创建目的是收集与税收相关的法国法律文本,以支持法律文本的自动化处理和分析。

--- 语言: - 法语 --- # 法语开放财政文本数据集 数据集卡片(Dataset Card) ## 目录 - [数据集概述](#dataset-description) - [数据集摘要](#dataset-summary) - [支持任务与评测榜单](#supported-tasks-and-leaderboards) - [语言](#languages) - [数据集结构](#dataset-structure) - [数据实例](#data-instances) - [数据字段](#data-fields) - [数据划分](#data-splits) - [数据集构建](#dataset-creation) - [遴选依据](#curation-rationale) - [源数据](#source-data) - [标注](#annotations) - [个人与敏感信息](#personal-and-sensitive-information) - [数据集使用注意事项](#considerations-for-using-the-data) - [数据集的社会影响](#social-impact-of-dataset) - [偏倚讨论](#discussion-of-biases) - [其他已知局限性](#other-known-limitations) - [附加信息](#additional-information) - [数据集管护者](#dataset-curators) - [许可信息](#licensing-information) - [引用信息](#citation-information) ## 数据集概述 - **主页**:https://echanges.dila.gouv.fr/OPENDATA/JADE/ - **代码仓库**:[需补充更多信息] - **相关论文**:[需补充更多信息] - **评测榜单**:[需补充更多信息] - **联络人**:[需补充更多信息] ### 数据集摘要 本数据集提取自OPENDATA/JADE平台,收录法国国务委员会(Conseil d'Etat)的判例文本列表。 ### 支持任务与评测榜单 [需补充更多信息] ### 语言 fr-FR(法语-法国) ## 数据集结构 ### 数据实例 json { "file": "CETATEXT000007584427.xml", "title": "马赛行政上诉法院,第3庭-3人合议庭,2004年10月21日,案号00MA01080,未收录于勒邦汇编(recueil Lebon)", "summary": "", "content": "鉴于罗杰X先生于2000年5月22日提交的申请,由其住所地律师吕埃尔纳(Me Luherne)代理……),以及2002年10月28日、2004年3月22日和2004年9月16日提交的补充答辩状;X先生向法院提出如下请求: 1. 撤销2000年3月16日作出的第951520号判决,该判决驳回了其关于减免1990、1991、1992年度附加所得税及相关滞纳金的申请; 2. 判令减免前述附加税项; 3. 判令国家向其支付32278法郎,合4920.75欧元" } > 注:原文示例中的`11/`、`22/`应为排版笔误,已修正为规范序号。 ### 数据字段 `file`:JADE OPENDATA 平台上的文件标识符 `title`:判例名称 `summary`:JADE 提供的判例摘要(可能缺失) `content`:判例文本内容 ### 数据划分 训练集(train)、测试集(test) ## 数据集构建 ### 遴选依据 本数据集旨在收集多份与税收相关的法国法律文本,初始目标为构建可生成判例摘要的模型。 ### 源数据 #### 初始数据采集与标准化 从https://echanges.dila.gouv.fr/OPENDATA/ 采集数据: - 筛选包含《普通税法典》(Code général des impôts)关键词的XML文件 - 提取文件内容、摘要、标识符及标题 #### 源文本生产者 DILA ### 标注 #### 标注流程 [需补充更多信息] #### 标注人员 [需补充更多信息] ### 个人与敏感信息 [需补充更多信息] ## 数据集使用注意事项 ### 数据集的社会影响 [需补充更多信息] ### 偏倚讨论 [需补充更多信息] ### 其他已知局限性 [需补充更多信息] ## 附加信息 ### 数据集管护者 [需补充更多信息] ### 许可信息 [需补充更多信息] ### 引用信息 [需补充更多信息]
提供机构:
StanBienaives
原始信息汇总

数据集概述

数据集名称

french-open-fiscal-texts

数据集来源

从OPENDATA/JADE中提取,包含法国行政法院的案例法律。

语言

fr-FR

数据集结构

数据实例

每个实例包含以下字段:

  • file: JADE OPENDATA文件的标识符
  • title: 法律案例名称
  • summary: 由JADE提供的案例摘要(可能缺失)
  • content: 案例法律的文本内容

数据字段

  • file: 文件标识符
  • title: 案例名称
  • summary: 案例摘要
  • content: 案例内容

数据分割

  • train
  • test

数据集创建

数据收集和规范化

  • 数据收集自https://echanges.dila.gouv.fr/OPENDATA/
  • 筛选包含“Code général des impôts”(税务相关)的XML文件
  • 提取内容、摘要、标识符、标题

源语言生产者

DILA

数据集目的

构建模型以总结法律案例

使用数据集的注意事项

  • 社会影响、偏见讨论、其他已知限制、数据集管理员、许可信息、引用信息等部分信息缺失,需进一步了解。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作