five

laugustyniak/abusive-clauses-pl

收藏
Hugging Face2023-03-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/laugustyniak/abusive-clauses-pl
下载链接
链接失效反馈
官方服务:
资源简介:
PAC - 波兰不公平条款数据集旨在通过自动化检测合同中的不公平条款来保护消费者权益。数据集将“不公平合同条款”视为滥用条款,定义为合同一方单方面强加的条款,对另一方产生不平等影响,或导致双方权利义务失衡。该数据集的任务是文本分类,输入为合同文本,输出为二元标签,表示合同条款是否公平。数据集分为训练集、开发集和测试集,类别分布显示了两类标签的比例。数据集采用CC BY-NC-SA 4.0许可证,并提供了引用信息。
提供机构:
laugustyniak
原始信息汇总

PAC - Polish Abusive Clauses Dataset 概述

数据集基本信息

  • 语言: 波兰语 (pl)
  • 许可证: 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可 (CC BY-NC-SA 4.0)
  • 多语言性: 单语种
  • 数据集大小: 10<n<10K
  • 任务类别: 文本分类

任务描述

  • 任务: 滥用条款检测
  • 输入 (text 列): 协议文本
  • 输出 (label 列): 二元标签 (BEZPIECZNE_POSTANOWIENIE_UMOWNE: 正确协议声明, KLAUZULA_ABUZYWNA: 滥用条款)
  • 领域: 法律协议
  • 评估指标: 准确率, F1 Macro

数据分割

子集 基数 (句子数)
训练集 4284
开发集 1519
测试集 3453

类别分布

类别 训练集 开发集 测试集
BEZPIECZNE_POSTANOWIENIE_UMOWNE 0.5458 0.3002 0.6756
KLAUZULA_ABUZYWNA 0.4542 0.6998 0.3244

许可证

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作