Saibo-creator/ptb-LLM-sketch
收藏Hugging Face2024-06-05 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Saibo-creator/ptb-LLM-sketch
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: input
dtype: string
- name: output
dtype: string
- name: prompt
dtype: 'null'
- name: label
dtype: string
splits:
- name: GPT4_unconstrained
num_bytes: 940878
num_examples: 1000
- name: GPT3.5_unconstrained
num_bytes: 931671
num_examples: 1000
- name: Claude_unconstrained
num_bytes: 875143
num_examples: 1000
- name: Claude_Instant_unconstrained
num_bytes: 911530
num_examples: 1000
download_size: 1552449
dataset_size: 3659222
configs:
- config_name: default
data_files:
- split: GPT4_unconstrained
path: data/GPT4_unconstrained-*
- split: GPT3.5_unconstrained
path: data/GPT3.5_unconstrained-*
- split: Claude_unconstrained
path: data/Claude_unconstrained-*
- split: Claude_Instant_unconstrained
path: data/Claude_Instant_unconstrained-*
---
提供机构:
Saibo-creator
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为
int64 - input: 数据类型为
string - output: 数据类型为
string - prompt: 数据类型为
null - label: 数据类型为
string
数据集分割
- GPT4_unconstrained:
- 字节数: 940878
- 样本数: 1000
- GPT3.5_unconstrained:
- 字节数: 931671
- 样本数: 1000
- Claude_unconstrained:
- 字节数: 875143
- 样本数: 1000
- Claude_Instant_unconstrained:
- 字节数: 911530
- 样本数: 1000
数据集大小
- 下载大小: 1552449 字节
- 数据集大小: 3659222 字节
配置
- config_name: default
- 数据文件:
- GPT4_unconstrained:
data/GPT4_unconstrained-* - GPT3.5_unconstrained:
data/GPT3.5_unconstrained-* - Claude_unconstrained:
data/Claude_unconstrained-* - Claude_Instant_unconstrained:
data/Claude_Instant_unconstrained-*
- GPT4_unconstrained:
- 数据文件:
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个文本模态的数据集,主要用于自然语言处理任务,包含4,000行数据,以Parquet格式存储,大小约为1.56 MB。数据集被分为多个基于不同大型语言模型(如GPT-4、GPT-3.5、Claude)的子集,每子集约1k行,其列包括输入文本、输出文本和标签(可能为句法树结构),适用于文本到结构转换或语言模型训练。
以上内容由遇见数据集搜集并总结生成



