five

nrishabh/prompt-recovery

收藏
Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nrishabh/prompt-recovery
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置都有不同的特征和数据分割。主要特征包括prompt、original_text和rewritten_text,或者prompt和completion。数据集分为训练集、验证集和测试集,每个集都有相应的字节大小和示例数量。数据集的不同配置可能用于不同的任务,如文本重写或文本生成。

该数据集包含多个配置,每个配置都有不同的特征和数据分割。主要特征包括prompt、original_text和rewritten_text,或者prompt和completion。数据集分为训练集、验证集和测试集,每个集都有相应的字节大小和示例数量。数据集的不同配置可能用于不同的任务,如文本重写或文本生成。
提供机构:
nrishabh
原始信息汇总

数据集概述

数据集配置

1. large

  • 特征:
    • prompt: string
    • original_text: string
    • rewritten_text: string
  • 分割:
    • train: 1260个样本, 5766395字节
    • validation: 180个样本, 161853字节
    • test: 360个样本, 1490939字节
  • 下载大小: 1646901字节
  • 数据集大小: 7419187字节

2. large-llama

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 1260个样本, 6085083字节
    • validation: 180个样本, 207391字节
    • test: 360个样本, 1582004字节
  • 下载大小: 3652048字节
  • 数据集大小: 7874478字节

3. large-llama-instr

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 1260个样本, 5872235字节
    • validation: 180个样本, 176973字节
    • test: 360个样本, 1521179字节
  • 下载大小: 3602262字节
  • 数据集大小: 7570387字节

4. medium

  • 特征:
    • prompt: string
    • original_text: string
    • rewritten_text: string
  • 分割:
    • train: 840个样本, 3746098字节
    • validation: 120个样本, 138307字节
    • test: 240个样本, 988583字节
  • 下载大小: 1100857字节
  • 数据集大小: 4872988字节

5. medium-llama

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 840个样本, 3958553字节
    • validation: 120个样本, 168657字节
    • test: 240个样本, 1049284字节
  • 下载大小: 2320471字节
  • 数据集大小: 5176494字节

6. medium-llama-instr

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 840个样本, 3816658字节
    • validation: 120个样本, 148387字节
    • test: 240个样本, 1008743字节
  • 下载大小: 2289077字节
  • 数据集大小: 4973788字节

7. mini

  • 特征:
    • prompt: string
    • original_text: string
    • rewritten_text: string
  • 分割:
    • train: 420个样本, 1870241字节
    • validation: 60个样本, 70006字节
    • test: 120个样本, 488397字节
  • 下载大小: 585795字节
  • 数据集大小: 2428644字节

8. mini-llama

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 420个样本, 1976482字节
    • validation: 60个样本, 85185字节
    • test: 120个样本, 518754字节
  • 下载大小: 1072055字节
  • 数据集大小: 2580421字节

9. mini-llama-instr

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 420个样本, 1905521字节
    • validation: 60个样本, 75046字节
    • test: 120个样本, 498477字节
  • 下载大小: 1066590字节
  • 数据集大小: 2479044字节

10. minute

  • 特征:
    • prompt: string
    • original_text: string
    • rewritten_text: string
  • 分割:
    • train: 42个样本, 198202字节
    • validation: 6个样本, 7453字节
    • test: 12个样本, 48620字节
  • 下载大小: 139062字节
  • 数据集大小: 254275字节

11. minute-llama

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 42个样本, 208824字节
    • validation: 6个样本, 8971字节
    • test: 12个样本, 51655字节
  • 下载大小: 149117字节
  • 数据集大小: 269450字节

12. minute-llama-instr

  • 特征:
    • prompt: string
    • completion: string
  • 分割:
    • train: 42个样本, 201730字节
    • validation: 6个样本, 7957字节
    • test: 12个样本, 49628字节
  • 下载大小: 144464字节
  • 数据集大小: 259315字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作