Truthful/autotrain-data-provision_classification
收藏Hugging Face2022-08-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Truthful/autotrain-data-provision_classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目provision_classification自动处理的AutoTrain数据集,主要用于文本分类任务。数据集的样本包含文本和对应的目标标签,目标标签共有19个类别,涵盖了法律文档中的各种条款类型。数据集分为训练集和验证集,分别包含119023和13225个样本。
提供机构:
Truthful
原始信息汇总
数据集概述
数据集描述
该数据集是为项目“provision_classification”自动处理而生成的,用于文本分类任务。
语言
数据集的语言代码为unk。
数据集结构
数据实例
数据集中的样本包含以下字段:
- text: 文本内容,类型为字符串。
- target: 目标分类,包含19个类别,分别为Assignment, Attorney Fees, Bankruptcy, Change of Control, Compliance with Laws, Confidentiality, Entire Agreement, General Definition, Governing Law, Indemnification, Injunctive Relief, Jurisdiction and Venue, Liens, No Warranties, Other, Permitted Disclosure, Survival, Term, Termination for Convenience。
数据集分割
数据集被分割为训练集和验证集,具体分割情况如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 119023 |
| 验证集 | 13225 |



