eitanturok/oasst-code
收藏Hugging Face2024-03-08 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/eitanturok/oasst-code
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: dedup
features:
- name: prompt
dtype: string
- name: response
dtype: string
splits:
- name: train
num_bytes: 67729
num_examples: 41
download_size: 45169
dataset_size: 67729
- config_name: dedup-en
features:
- name: prompt
dtype: string
- name: response
dtype: string
splits:
- name: train
num_bytes: 35360
num_examples: 20
download_size: 28051
dataset_size: 35360
- config_name: instructions
features:
- name: prompt
dtype: string
- name: response
dtype: string
splits:
- name: train
num_bytes: 265722
num_examples: 151
download_size: 45795
dataset_size: 265722
- config_name: v0
features:
- name: prompt
dtype: string
- name: response
dtype: string
splits:
- name: train
num_bytes: 258323
num_examples: 151
download_size: 45285
dataset_size: 258323
configs:
- config_name: dedup
data_files:
- split: train
path: dedup/train-*
- config_name: dedup-en
data_files:
- split: train
path: dedup-en/train-*
- config_name: instructions
data_files:
- split: train
path: instructions/train-*
- config_name: v0
data_files:
- split: train
path: v0/train-*
---
# Dataset Card for "commitpack-oasst"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
- 配置名称:dedup
数据特征:
- 提示词(prompt):数据类型为字符串
- 回复(response):数据类型为字符串
拆分集:
- 训练集(train):字节数67729,样本数量41
下载大小:45169,数据集总大小:67729
- 配置名称:dedup-en
数据特征:
- 提示词(prompt):数据类型为字符串
- 回复(response):数据类型为字符串
拆分集:
- 训练集(train):字节数35360,样本数量20
下载大小:28051,数据集总大小:35360
- 配置名称:instructions
数据特征:
- 提示词(prompt):数据类型为字符串
- 回复(response):数据类型为字符串
拆分集:
- 训练集(train):字节数265722,样本数量151
下载大小:45795,数据集总大小:265722
- 配置名称:v0
数据特征:
- 提示词(prompt):数据类型为字符串
- 回复(response):数据类型为字符串
拆分集:
- 训练集(train):字节数258323,样本数量151
下载大小:45285,数据集总大小:258323
配置项:
- 配置名称:dedup,数据文件:
- 拆分集:train,路径:dedup/train-*
- 配置名称:dedup-en,数据文件:
- 拆分集:train,路径:dedup-en/train-*
- 配置名称:instructions,数据文件:
- 拆分集:train,路径:instructions/train-*
- 配置名称:v0,数据文件:
- 拆分集:train,路径:v0/train-*
# "commitpack-oasst"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
eitanturok
原始信息汇总
数据集概述
数据集配置
dedup
- 特征:
prompt: 字符串类型response: 字符串类型
- 分割:
train:- 字节数: 67729
- 样本数: 41
- 下载大小: 45169
- 数据集大小: 67729
dedup-en
- 特征:
prompt: 字符串类型response: 字符串类型
- 分割:
train:- 字节数: 35360
- 样本数: 20
- 下载大小: 28051
- 数据集大小: 35360
instructions
- 特征:
prompt: 字符串类型response: 字符串类型
- 分割:
train:- 字节数: 265722
- 样本数: 151
- 下载大小: 45795
- 数据集大小: 265722
v0
- 特征:
prompt: 字符串类型response: 字符串类型
- 分割:
train:- 字节数: 258323
- 样本数: 151
- 下载大小: 45285
- 数据集大小: 258323
数据文件路径
dedup
train: dedup/train-*
dedup-en
train: dedup-en/train-*
instructions
train: instructions/train-*
v0
train: v0/train-*



