redwoodresearch/generated_stories
收藏Hugging Face2023-08-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/redwoodresearch/generated_stories
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个配置:default、easier、main和test,每个配置都有训练集和验证集。数据集的特征包括文本、是否正确、是否干净、整体篡改证据、测量值和个体篡改证据。每个配置的训练集和验证集的大小和样本数量也有所不同。
该数据集包含四个配置:default、easier、main和test,每个配置都有训练集和验证集。数据集的特征包括文本、是否正确、是否干净、整体篡改证据、测量值和个体篡改证据。每个配置的训练集和验证集的大小和样本数量也有所不同。
提供机构:
redwoodresearch
原始信息汇总
数据集概述
配置信息
默认配置
- 数据文件路径:
- 训练集:
data/train-* - 验证集:
data/validation-*
- 训练集:
- 特征:
text: 字符串类型is_correct: 布尔类型is_clean: 布尔类型overall_tamper_evidence: 布尔类型measurements: 序列类型individual_tamper_evidence: 序列类型
- 数据集统计:
- 训练集: 3825个样本,18613577字节
- 验证集: 675个样本,3281253字节
- 下载大小: 9158407字节
- 数据集大小: 21894830字节
简化配置
- 数据文件路径:
- 训练集:
easier/train-* - 验证集:
easier/validation-*
- 训练集:
- 特征:
text: 字符串类型is_correct: 布尔类型is_clean: 布尔类型overall_tamper_evidence: 布尔类型measurements: 序列类型individual_tamper_evidence: 序列类型
- 数据集统计:
- 训练集: 2544个样本,12556260字节
- 验证集: 1051个样本,5203051字节
- 下载大小: 7475754字节
- 数据集大小: 17759311字节
主要配置
- 数据文件路径:
- 训练集:
main/train-* - 验证集:
main/validation-*
- 训练集:
- 特征:
text: 字符串类型is_correct: 布尔类型is_clean: 布尔类型overall_tamper_evidence: 布尔类型measurements: 序列类型individual_tamper_evidence: 序列类型
- 数据集统计:
- 训练集: 3825个样本,18613577字节
- 验证集: 675个样本,3281253字节
- 下载大小: 9158407字节
- 数据集大小: 21894830字节
测试配置
- 数据文件路径:
- 训练集:
test/train-* - 验证集:
test/validation-*
- 训练集:
- 特征:
text: 字符串类型is_correct: 布尔类型is_clean: 布尔类型overall_tamper_evidence: 布尔类型measurements: 序列类型individual_tamper_evidence: 序列类型
- 数据集统计:
- 训练集: 3825个样本,18613577字节
- 验证集: 675个样本,3281253字节
- 下载大小: 9158407字节
- 数据集大小: 21894830字节



