dbuos/oasst_top1_en
收藏Hugging Face2023-12-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dbuos/oasst_top1_en
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- en
license: apache-2.0
size_categories:
- 1K<n<10K
dataset_info:
features:
- name: text
dtype: string
- name: lang
dtype: string
- name: num_turns
dtype: int64
splits:
- name: train
num_bytes: 9908776
num_examples: 5023
download_size: 5271098
dataset_size: 9908776
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
#### OpenAssistant TOP-1 Conversation Threads
##### Guanacco style export of the best conversation threads from the open-assistant.io database
- exported August 25, 2023
- jsonl files with chatml formatted conversations
- train: 5,023 samples
- Only English examples
- Add column to count number of messages
提供机构:
dbuos
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
- 数据量: 1K < n < 10K
数据集结构
- 特征:
- text: 字符串类型
- lang: 字符串类型
- num_turns: 整数类型 (int64)
- 分割:
- train: 包含5023个样本,总字节数为9908776字节
下载信息
- 下载大小: 5271098字节
- 数据集大小: 9908776字节
配置
- 默认配置:
- 数据文件:
- train: 路径为
data/train-*
- train: 路径为
- 数据文件:
详细描述
- 数据集名称: OpenAssistant TOP-1 Conversation Threads
- 数据格式: jsonl文件,采用chatml格式的对话
- 导出日期: 2023年8月25日
- 样本数量: 训练集包含5023个样本
- 语言限制: 仅包含英语示例
- 额外列: 包含用于计数消息数量的列



