CodeHima/TOS_Dataset
收藏Hugging Face2024-06-28 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/CodeHima/TOS_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自服务条款(ToS)文档的条款,每个条款都标注了公平性级别。数据集包括标注为“clearly_fair”(明显公平)、“potentially_unfair”(可能不公平)和“clearly_unfair”(明显不公平)的条款。数据集由从各种ToS文档中提取的条款组成,每个条款都标注了公平性级别,用于多类分类任务。数据集分为训练集、验证集和测试集,分别包含5378、415和1038个样本。
This dataset contains clauses from Terms of Service (ToS) documents with annotations indicating the fairness level of each clause. The dataset includes clauses labeled as `clearly_fair`, `potentially_unfair`, and `clearly_unfair`. The dataset comprises clauses extracted from various ToS documents. Each clause is annotated with a fairness level, indicating whether it is clearly fair, potentially unfair, or clearly unfair. The dataset is split into three sets: train, validation, and test, containing 5378, 415, and 1038 samples respectively.
提供机构:
CodeHima
原始信息汇总
TOS_Dataset
数据集概述
该数据集包含从服务条款(ToS)文档中提取的条款,并标注了每个条款的公平性等级。数据集包括标注为 clearly_fair、potentially_unfair 和 clearly_unfair 的条款。
支持的任务
该数据集可用于多类分类任务,特别是用于分类服务条款文档中条款的公平性。
语言
数据集为英文。
数据集结构
数据集分为三个部分:训练集、验证集和测试集。
数据字段
sentence: 服务条款文档中的条款。unfairness_level: 分配给条款的公平性等级。可能的值为clearly_fair、potentially_unfair和clearly_unfair。
数据分割
| 分割 | 数量 |
|---|---|
| 训练集 | 5.38k 行 |
| 验证集 | 415 行 |
| 测试集 | 1.04k 行 |
许可证
该数据集采用 MIT 许可证。



