acmc/watermarked_c4_dataset_reduced
收藏Hugging Face2024-06-13 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/acmc/watermarked_c4_dataset_reduced
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文本、时间戳、URL、生成标志、模型名称和结果列表。结果列表中包含生成标志、标签、元数据和分数。元数据进一步包含函数、模型和参数信息。数据集分为训练集,包含10个样本,总大小为12628字节。
该数据集包含多个特征,如文本、时间戳、URL、生成标志、模型名称和结果列表。结果列表中包含生成标志、标签、元数据和分数。元数据进一步包含函数、模型和参数信息。数据集分为训练集,包含10个样本,总大小为12628字节。
提供机构:
acmc
原始信息汇总
数据集概述
数据集信息
特征
- text: 类型为
string - timestamp: 类型为
string - url: 类型为
string - generated: 类型为
bool - model: 类型为
string - results: 列表类型,包含以下子特征:
- generated: 类型为
int64 - label: 类型为
int64 - metadata: 结构类型,包含以下子特征:
- func: 类型为
string - model: 类型为
string - params: 结构类型,包含以下子特征:
- percentage: 类型为
float64
- percentage: 类型为
- func: 类型为
- score: 类型为
float64
- generated: 类型为
数据分割
- train: 包含 10 个样本,占用 12628 字节
数据集大小
- 下载大小: 19635 字节
- 数据集大小: 12628 字节
配置
- config_name:
default - data_files:
- split:
train - path:
data/train-*
- split:



