akoukas/autextification2
收藏Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/akoukas/autextification2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于区分文本是由机器生成还是人类编写。数据集包含text文本内容和label标签,标签指示文本是generated(生成)还是human(人类)。数据集分为训练集、测试集和验证集,分别包含27076、3385和3384个示例。数据集的总大小约为10.76GB,下载大小约为6.33GB。
该数据集主要用于区分文本是由机器生成还是人类编写。数据集包含text文本内容和label标签,标签指示文本是generated(生成)还是human(人类)。数据集分为训练集、测试集和验证集,分别包含27076、3385和3384个示例。数据集的总大小约为10.76GB,下载大小约为6.33GB。
提供机构:
akoukas
原始信息汇总
数据集概述
特征信息
- text: 数据类型为字符串。
- label: 数据类型为类别标签,包含两个类别:
0: generated1: human
数据分割
- train: 包含27076个样本,总字节数为8606540.8。
- test: 包含3385个样本,总字节数为1075976.533018171。
- validation: 包含3384个样本,总字节数为1075658.6669818289。
数据集大小
- 下载大小: 6332520字节
- 数据集大小: 10758176.000000002字节
配置信息
- default:
- train: 文件路径为
data/train-* - test: 文件路径为
data/test-* - validation: 文件路径为
data/validation-*
- train: 文件路径为



