xezpeleta/oasst2_top1_chat_format
收藏Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xezpeleta/oasst2_top1_chat_format
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: conversation
list:
- name: content
dtype: string
- name: role
dtype: string
- name: langs
dtype: string
splits:
- name: train
num_bytes: 18366000
num_examples: 10746
download_size: 10484376
dataset_size: 18366000
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息如下:
1. 特征字段:
- 对话(conversation):列表类型,其列表元素包含两个子字段:
- 内容(content):数据类型为字符串
- 角色(role):数据类型为字符串
- 语言标识(langs):数据类型为字符串
2. 数据划分:
- 训练集(train):占用字节数为18366000,共包含10746条样本
3. 相关大小参数:
- 下载大小:10484376
- 数据集总大小:18366000
4. 配置项:
- 默认配置:对应训练集划分的数据文件路径为`data/train-*`
提供机构:
xezpeleta
原始信息汇总
数据集概述
数据集信息
特征
- conversation:
- content: 数据类型为字符串
- role: 数据类型为字符串
- langs: 数据类型为字符串
数据分割
- train:
- 字节数: 18366000
- 样本数: 10746
数据大小
- 下载大小: 10484376
- 数据集大小: 18366000
配置
- default:
- 数据文件:
- train: 路径为
data/train-*
- train: 路径为
- 数据文件:



