laugustyniak/abusive-clauses-pl
收藏Hugging Face2023-03-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/laugustyniak/abusive-clauses-pl
下载链接
链接失效反馈官方服务:
资源简介:
PAC - 波兰不公平条款数据集旨在通过自动化检测合同中的不公平条款来保护消费者权益。数据集将“不公平合同条款”视为滥用条款,定义为合同一方单方面强加的条款,对另一方产生不平等影响,或导致双方权利义务失衡。该数据集的任务是文本分类,输入为合同文本,输出为二元标签,表示合同条款是否公平。数据集分为训练集、开发集和测试集,类别分布显示了两类标签的比例。数据集采用CC BY-NC-SA 4.0许可证,并提供了引用信息。
提供机构:
laugustyniak
原始信息汇总
PAC - Polish Abusive Clauses Dataset 概述
数据集基本信息
- 语言: 波兰语 (pl)
- 许可证: 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可 (CC BY-NC-SA 4.0)
- 多语言性: 单语种
- 数据集大小: 10<n<10K
- 任务类别: 文本分类
任务描述
- 任务: 滥用条款检测
- 输入 (text 列): 协议文本
- 输出 (label 列): 二元标签 (
BEZPIECZNE_POSTANOWIENIE_UMOWNE: 正确协议声明,KLAUZULA_ABUZYWNA: 滥用条款) - 领域: 法律协议
- 评估指标: 准确率, F1 Macro
数据分割
| 子集 | 基数 (句子数) |
|---|---|
| 训练集 | 4284 |
| 开发集 | 1519 |
| 测试集 | 3453 |
类别分布
| 类别 | 训练集 | 开发集 | 测试集 |
|---|---|---|---|
| BEZPIECZNE_POSTANOWIENIE_UMOWNE | 0.5458 | 0.3002 | 0.6756 |
| KLAUZULA_ABUZYWNA | 0.4542 | 0.6998 | 0.3244 |



