flydust/tulu-v2-sft-mixture-sharegpt
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/flydust/tulu-v2-sft-mixture-sharegpt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是将allenai/tulu-v2-sft-mixture转换为sharegpt格式的结果。数据集包含多个特征,如数据集名称、ID和对话内容。对话内容是一个列表,包含发送者和消息值。数据集分为训练集,包含326,154个示例,总大小为1,231,388,422字节,下载大小为554,379,804字节。
该数据集是将allenai/tulu-v2-sft-mixture转换为sharegpt格式的结果。数据集包含多个特征,如数据集名称、ID和对话内容。对话内容是一个列表,包含发送者和消息值。数据集分为训练集,包含326,154个示例,总大小为1,231,388,422字节,下载大小为554,379,804字节。
提供机构:
flydust
原始信息汇总
数据集概述
数据集基本信息
- 许可证: odc-by
数据集特征
- dataset: 数据类型为字符串
- id: 数据类型为字符串
- conversations: 列表类型,包含以下子特征:
- from: 数据类型为字符串
- value: 数据类型为字符串
数据集分割
- 训练集 (train):
- 数据量: 326154个示例
- 存储大小: 1231388422字节
- 下载大小: 554379804字节
数据文件配置
- 配置名称: default
- 数据文件路径:
- 分割类型: 训练集
- 路径: data/train-*



