CodeHima/TOS_Dataset

Name: CodeHima/TOS_Dataset
Creator: CodeHima
Published: 2024-06-28 20:15:19
License: 暂无描述

Hugging Face2024-06-28 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/CodeHima/TOS_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含来自服务条款（ToS）文档的条款，每个条款都标注了公平性级别。数据集包括标注为“clearly_fair”（明显公平）、“potentially_unfair”（可能不公平）和“clearly_unfair”（明显不公平）的条款。数据集由从各种ToS文档中提取的条款组成，每个条款都标注了公平性级别，用于多类分类任务。数据集分为训练集、验证集和测试集，分别包含5378、415和1038个样本。

This dataset contains clauses from Terms of Service (ToS) documents with annotations indicating the fairness level of each clause. The dataset includes clauses labeled as `clearly_fair`, `potentially_unfair`, and `clearly_unfair`. The dataset comprises clauses extracted from various ToS documents. Each clause is annotated with a fairness level, indicating whether it is clearly fair, potentially unfair, or clearly unfair. The dataset is split into three sets: train, validation, and test, containing 5378, 415, and 1038 samples respectively.

提供机构：

CodeHima

原始信息汇总

TOS_Dataset

数据集概述

该数据集包含从服务条款（ToS）文档中提取的条款，并标注了每个条款的公平性等级。数据集包括标注为 clearly_fair、potentially_unfair 和 clearly_unfair 的条款。

支持的任务

该数据集可用于多类分类任务，特别是用于分类服务条款文档中条款的公平性。

语言

数据集为英文。

数据集结构

数据集分为三个部分：训练集、验证集和测试集。

数据字段

sentence: 服务条款文档中的条款。
unfairness_level: 分配给条款的公平性等级。可能的值为 clearly_fair、potentially_unfair 和 clearly_unfair。

数据分割

分割	数量
训练集	5.38k 行
验证集	415 行
测试集	1.04k 行

许可证

该数据集采用 MIT 许可证。

5,000+

优质数据集

54 个

任务类型

进入经典数据集