five

CodeHima/TOS_Dataset

收藏
Hugging Face2024-06-28 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/CodeHima/TOS_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自服务条款(ToS)文档的条款,每个条款都标注了公平性级别。数据集包括标注为“clearly_fair”(明显公平)、“potentially_unfair”(可能不公平)和“clearly_unfair”(明显不公平)的条款。数据集由从各种ToS文档中提取的条款组成,每个条款都标注了公平性级别,用于多类分类任务。数据集分为训练集、验证集和测试集,分别包含5378、415和1038个样本。

This dataset contains clauses from Terms of Service (ToS) documents with annotations indicating the fairness level of each clause. The dataset includes clauses labeled as `clearly_fair`, `potentially_unfair`, and `clearly_unfair`. The dataset comprises clauses extracted from various ToS documents. Each clause is annotated with a fairness level, indicating whether it is clearly fair, potentially unfair, or clearly unfair. The dataset is split into three sets: train, validation, and test, containing 5378, 415, and 1038 samples respectively.
提供机构:
CodeHima
原始信息汇总

TOS_Dataset

数据集概述

该数据集包含从服务条款(ToS)文档中提取的条款,并标注了每个条款的公平性等级。数据集包括标注为 clearly_fairpotentially_unfairclearly_unfair 的条款。

支持的任务

该数据集可用于多类分类任务,特别是用于分类服务条款文档中条款的公平性。

语言

数据集为英文。

数据集结构

数据集分为三个部分:训练集、验证集和测试集。

数据字段

  • sentence: 服务条款文档中的条款。
  • unfairness_level: 分配给条款的公平性等级。可能的值为 clearly_fairpotentially_unfairclearly_unfair

数据分割

分割 数量
训练集 5.38k 行
验证集 415 行
测试集 1.04k 行

许可证

该数据集采用 MIT 许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作