StanBienaives/french-open-fiscal-texts
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/StanBienaives/french-open-fiscal-texts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从法国法院Conseil dEtat的案例法中提取的,主要用于构建法律案例摘要模型。数据集包含文件的标识符、案例名称、摘要(可能缺失)和案例内容。数据集分为训练集和测试集。数据集的创建目的是收集与税收相关的法国法律文本,以支持法律文本的自动化处理和分析。
---
语言:
- 法语
---
# 法语开放财政文本数据集 数据集卡片(Dataset Card)
## 目录
- [数据集概述](#dataset-description)
- [数据集摘要](#dataset-summary)
- [支持任务与评测榜单](#supported-tasks-and-leaderboards)
- [语言](#languages)
- [数据集结构](#dataset-structure)
- [数据实例](#data-instances)
- [数据字段](#data-fields)
- [数据划分](#data-splits)
- [数据集构建](#dataset-creation)
- [遴选依据](#curation-rationale)
- [源数据](#source-data)
- [标注](#annotations)
- [个人与敏感信息](#personal-and-sensitive-information)
- [数据集使用注意事项](#considerations-for-using-the-data)
- [数据集的社会影响](#social-impact-of-dataset)
- [偏倚讨论](#discussion-of-biases)
- [其他已知局限性](#other-known-limitations)
- [附加信息](#additional-information)
- [数据集管护者](#dataset-curators)
- [许可信息](#licensing-information)
- [引用信息](#citation-information)
## 数据集概述
- **主页**:https://echanges.dila.gouv.fr/OPENDATA/JADE/
- **代码仓库**:[需补充更多信息]
- **相关论文**:[需补充更多信息]
- **评测榜单**:[需补充更多信息]
- **联络人**:[需补充更多信息]
### 数据集摘要
本数据集提取自OPENDATA/JADE平台,收录法国国务委员会(Conseil d'Etat)的判例文本列表。
### 支持任务与评测榜单
[需补充更多信息]
### 语言
fr-FR(法语-法国)
## 数据集结构
### 数据实例
json
{
"file": "CETATEXT000007584427.xml",
"title": "马赛行政上诉法院,第3庭-3人合议庭,2004年10月21日,案号00MA01080,未收录于勒邦汇编(recueil Lebon)",
"summary": "",
"content": "鉴于罗杰X先生于2000年5月22日提交的申请,由其住所地律师吕埃尔纳(Me Luherne)代理……),以及2002年10月28日、2004年3月22日和2004年9月16日提交的补充答辩状;X先生向法院提出如下请求:
1. 撤销2000年3月16日作出的第951520号判决,该判决驳回了其关于减免1990、1991、1992年度附加所得税及相关滞纳金的申请;
2. 判令减免前述附加税项;
3. 判令国家向其支付32278法郎,合4920.75欧元"
}
> 注:原文示例中的`11/`、`22/`应为排版笔误,已修正为规范序号。
### 数据字段
`file`:JADE OPENDATA 平台上的文件标识符
`title`:判例名称
`summary`:JADE 提供的判例摘要(可能缺失)
`content`:判例文本内容
### 数据划分
训练集(train)、测试集(test)
## 数据集构建
### 遴选依据
本数据集旨在收集多份与税收相关的法国法律文本,初始目标为构建可生成判例摘要的模型。
### 源数据
#### 初始数据采集与标准化
从https://echanges.dila.gouv.fr/OPENDATA/ 采集数据:
- 筛选包含《普通税法典》(Code général des impôts)关键词的XML文件
- 提取文件内容、摘要、标识符及标题
#### 源文本生产者
DILA
### 标注
#### 标注流程
[需补充更多信息]
#### 标注人员
[需补充更多信息]
### 个人与敏感信息
[需补充更多信息]
## 数据集使用注意事项
### 数据集的社会影响
[需补充更多信息]
### 偏倚讨论
[需补充更多信息]
### 其他已知局限性
[需补充更多信息]
## 附加信息
### 数据集管护者
[需补充更多信息]
### 许可信息
[需补充更多信息]
### 引用信息
[需补充更多信息]
提供机构:
StanBienaives
原始信息汇总
数据集概述
数据集名称
french-open-fiscal-texts
数据集来源
从OPENDATA/JADE中提取,包含法国行政法院的案例法律。
语言
fr-FR
数据集结构
数据实例
每个实例包含以下字段:
file: JADE OPENDATA文件的标识符title: 法律案例名称summary: 由JADE提供的案例摘要(可能缺失)content: 案例法律的文本内容
数据字段
file: 文件标识符title: 案例名称summary: 案例摘要content: 案例内容
数据分割
traintest
数据集创建
数据收集和规范化
- 数据收集自https://echanges.dila.gouv.fr/OPENDATA/
- 筛选包含“Code général des impôts”(税务相关)的XML文件
- 提取内容、摘要、标识符、标题
源语言生产者
DILA
数据集目的
构建模型以总结法律案例
使用数据集的注意事项
- 社会影响、偏见讨论、其他已知限制、数据集管理员、许可信息、引用信息等部分信息缺失,需进一步了解。



