five

redwoodresearch/generated_stories

收藏
Hugging Face2023-08-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/redwoodresearch/generated_stories
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个配置:default、easier、main和test,每个配置都有训练集和验证集。数据集的特征包括文本、是否正确、是否干净、整体篡改证据、测量值和个体篡改证据。每个配置的训练集和验证集的大小和样本数量也有所不同。

该数据集包含四个配置:default、easier、main和test,每个配置都有训练集和验证集。数据集的特征包括文本、是否正确、是否干净、整体篡改证据、测量值和个体篡改证据。每个配置的训练集和验证集的大小和样本数量也有所不同。
提供机构:
redwoodresearch
原始信息汇总

数据集概述

配置信息

默认配置

  • 数据文件路径:
    • 训练集: data/train-*
    • 验证集: data/validation-*
  • 特征:
    • text: 字符串类型
    • is_correct: 布尔类型
    • is_clean: 布尔类型
    • overall_tamper_evidence: 布尔类型
    • measurements: 序列类型
    • individual_tamper_evidence: 序列类型
  • 数据集统计:
    • 训练集: 3825个样本,18613577字节
    • 验证集: 675个样本,3281253字节
    • 下载大小: 9158407字节
    • 数据集大小: 21894830字节

简化配置

  • 数据文件路径:
    • 训练集: easier/train-*
    • 验证集: easier/validation-*
  • 特征:
    • text: 字符串类型
    • is_correct: 布尔类型
    • is_clean: 布尔类型
    • overall_tamper_evidence: 布尔类型
    • measurements: 序列类型
    • individual_tamper_evidence: 序列类型
  • 数据集统计:
    • 训练集: 2544个样本,12556260字节
    • 验证集: 1051个样本,5203051字节
    • 下载大小: 7475754字节
    • 数据集大小: 17759311字节

主要配置

  • 数据文件路径:
    • 训练集: main/train-*
    • 验证集: main/validation-*
  • 特征:
    • text: 字符串类型
    • is_correct: 布尔类型
    • is_clean: 布尔类型
    • overall_tamper_evidence: 布尔类型
    • measurements: 序列类型
    • individual_tamper_evidence: 序列类型
  • 数据集统计:
    • 训练集: 3825个样本,18613577字节
    • 验证集: 675个样本,3281253字节
    • 下载大小: 9158407字节
    • 数据集大小: 21894830字节

测试配置

  • 数据文件路径:
    • 训练集: test/train-*
    • 验证集: test/validation-*
  • 特征:
    • text: 字符串类型
    • is_correct: 布尔类型
    • is_clean: 布尔类型
    • overall_tamper_evidence: 布尔类型
    • measurements: 序列类型
    • individual_tamper_evidence: 序列类型
  • 数据集统计:
    • 训练集: 3825个样本,18613577字节
    • 验证集: 675个样本,3281253字节
    • 下载大小: 9158407字节
    • 数据集大小: 21894830字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作