g-ronimo/oasst2_top1_en
收藏Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/g-ronimo/oasst2_top1_en
下载链接
链接失效反馈官方服务:
资源简介:
数据集oasst2_top1_en是从OpenAssistant的oasst2数据集中筛选出的前1%的英文对话。这些对话经过语言过滤,仅包含英文。数据集的特征包括对话内容和角色,分为训练集,包含5419个例子,总大小为10491824字节。数据集的下载大小为5658552字节,使用Apache 2.0许可证。
数据集oasst2_top1_en是从OpenAssistant的oasst2数据集中筛选出的前1%的英文对话。这些对话经过语言过滤,仅包含英文。数据集的特征包括对话内容和角色,分为训练集,包含5419个例子,总大小为10491824字节。数据集的下载大小为5658552字节,使用Apache 2.0许可证。
提供机构:
g-ronimo
原始信息汇总
数据集概述
数据集信息
- 特征:
- conversation:
- content: 数据类型为字符串
- role: 数据类型为字符串
- conversation:
- 分割:
- train:
- 字节数: 10491824
- 样本数: 5419
- train:
- 下载大小: 5658552
- 数据集大小: 10491824
配置
- 默认配置:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
许可证
- 许可证: apache-2.0



