nrishabh/prompt-recovery
收藏Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nrishabh/prompt-recovery
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置都有不同的特征和数据分割。主要特征包括prompt、original_text和rewritten_text,或者prompt和completion。数据集分为训练集、验证集和测试集,每个集都有相应的字节大小和示例数量。数据集的不同配置可能用于不同的任务,如文本重写或文本生成。
该数据集包含多个配置,每个配置都有不同的特征和数据分割。主要特征包括prompt、original_text和rewritten_text,或者prompt和completion。数据集分为训练集、验证集和测试集,每个集都有相应的字节大小和示例数量。数据集的不同配置可能用于不同的任务,如文本重写或文本生成。
提供机构:
nrishabh
原始信息汇总
数据集概述
数据集配置
1. large
- 特征:
prompt: stringoriginal_text: stringrewritten_text: string
- 分割:
train: 1260个样本, 5766395字节validation: 180个样本, 161853字节test: 360个样本, 1490939字节
- 下载大小: 1646901字节
- 数据集大小: 7419187字节
2. large-llama
- 特征:
prompt: stringcompletion: string
- 分割:
train: 1260个样本, 6085083字节validation: 180个样本, 207391字节test: 360个样本, 1582004字节
- 下载大小: 3652048字节
- 数据集大小: 7874478字节
3. large-llama-instr
- 特征:
prompt: stringcompletion: string
- 分割:
train: 1260个样本, 5872235字节validation: 180个样本, 176973字节test: 360个样本, 1521179字节
- 下载大小: 3602262字节
- 数据集大小: 7570387字节
4. medium
- 特征:
prompt: stringoriginal_text: stringrewritten_text: string
- 分割:
train: 840个样本, 3746098字节validation: 120个样本, 138307字节test: 240个样本, 988583字节
- 下载大小: 1100857字节
- 数据集大小: 4872988字节
5. medium-llama
- 特征:
prompt: stringcompletion: string
- 分割:
train: 840个样本, 3958553字节validation: 120个样本, 168657字节test: 240个样本, 1049284字节
- 下载大小: 2320471字节
- 数据集大小: 5176494字节
6. medium-llama-instr
- 特征:
prompt: stringcompletion: string
- 分割:
train: 840个样本, 3816658字节validation: 120个样本, 148387字节test: 240个样本, 1008743字节
- 下载大小: 2289077字节
- 数据集大小: 4973788字节
7. mini
- 特征:
prompt: stringoriginal_text: stringrewritten_text: string
- 分割:
train: 420个样本, 1870241字节validation: 60个样本, 70006字节test: 120个样本, 488397字节
- 下载大小: 585795字节
- 数据集大小: 2428644字节
8. mini-llama
- 特征:
prompt: stringcompletion: string
- 分割:
train: 420个样本, 1976482字节validation: 60个样本, 85185字节test: 120个样本, 518754字节
- 下载大小: 1072055字节
- 数据集大小: 2580421字节
9. mini-llama-instr
- 特征:
prompt: stringcompletion: string
- 分割:
train: 420个样本, 1905521字节validation: 60个样本, 75046字节test: 120个样本, 498477字节
- 下载大小: 1066590字节
- 数据集大小: 2479044字节
10. minute
- 特征:
prompt: stringoriginal_text: stringrewritten_text: string
- 分割:
train: 42个样本, 198202字节validation: 6个样本, 7453字节test: 12个样本, 48620字节
- 下载大小: 139062字节
- 数据集大小: 254275字节
11. minute-llama
- 特征:
prompt: stringcompletion: string
- 分割:
train: 42个样本, 208824字节validation: 6个样本, 8971字节test: 12个样本, 51655字节
- 下载大小: 149117字节
- 数据集大小: 269450字节
12. minute-llama-instr
- 特征:
prompt: stringcompletion: string
- 分割:
train: 42个样本, 201730字节validation: 6个样本, 7957字节test: 12个样本, 49628字节
- 下载大小: 144464字节
- 数据集大小: 259315字节



