HuggingFaceTB/cosmopedia_2B_annotated_edu_score
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceTB/cosmopedia_2B_annotated_edu_score
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: text_token_length
dtype: int64
- name: text
dtype: string
- name: seed_data
dtype: string
- name: format
dtype: string
- name: audience
dtype: string
- name: seed_text
dtype: string
- name: prompt_score
dtype: string
- name: completion
dtype: string
- name: token_length
dtype: int64
- name: score
dtype: int64
splits:
- name: train
num_bytes: 27622238408.134834
num_examples: 2688753
download_size: 13674500139
dataset_size: 27622238408.134834
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
features:
- name: 提示词(prompt)
数据类型(dtype): 字符串(string)
- name: 文本Token长度(text_token_length)
数据类型(dtype): 64位整型(int64)
- name: 文本(text)
数据类型(dtype): 字符串(string)
- name: 种子数据(seed_data)
数据类型(dtype): 字符串(string)
- name: 格式(format)
数据类型(dtype): 字符串(string)
- name: 目标受众(audience)
数据类型(dtype): 字符串(string)
- name: 种子文本(seed_text)
数据类型(dtype): 字符串(string)
- name: 提示词评分(prompt_score)
数据类型(dtype): 字符串(string)
- name: 补全文本(completion)
数据类型(dtype): 字符串(string)
- name: Token长度(token_length)
数据类型(dtype): 64位整型(int64)
- name: 评分(score)
数据类型(dtype): 64位整型(int64)
splits:
- name: 训练集(train)
字节数(num_bytes): 27622238408.134834
样本数(num_examples): 2688753
下载大小(download_size): 13674500139
数据集大小(dataset_size): 27622238408.134834
configs:
- config_name: 默认配置(default)
数据文件(data_files):
- 数据划分(split): 训练集(train)
文件路径(path): data/train-*
提供机构:
HuggingFaceTB
原始信息汇总
数据集概述
数据集特征
- prompt:字符串类型
- text_token_length:整数类型(int64)
- text:字符串类型
- seed_data:字符串类型
- format:字符串类型
- audience:字符串类型
- seed_text:字符串类型
- prompt_score:字符串类型
- completion:字符串类型
- token_length:整数类型(int64)
- score:整数类型(int64)
数据集分割
- train:
- 数据量:27622238408.134834字节
- 示例数量:2688753
数据集大小
- 下载大小:13674500139字节
- 数据集总大小:27622238408.134834字节
配置
- config_name:default
- data_files:
- split:train
- path:data/train-*



