kaitchup/ultrachat-100k-flattened
收藏Hugging Face2023-10-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kaitchup/ultrachat-100k-flattened
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从stingning/ultrachat中随机抽取的10万条对话,并将对话扁平化为单一序列,每个对话轮次由Assistant或User角色引入。这种转换和子采样是为了加速使用HuggingFace的TRL进行训练。
提供机构:
kaitchup
原始信息汇总
数据集卡片 "ultrachat-100k-flattened"
概述
- 数据来源:从stingning/ultrachat随机抽取的100k对话样本。
- 数据格式:对话被展平为单一的对话轮序列,每个轮次由以下角色之一引导:
- 助手(Assistant)
- 用户(User)
数据配置
- 默认配置:
- 训练集:
- 路径:
data/train-* - 字节数:632072903
- 样本数:100000
- 路径:
- 测试集:
- 路径:
data/test-* - 字节数:32563073
- 样本数:5140
- 路径:
- 训练集:
数据特征
- 特征名称:text
- 数据类型:string
数据大小
- 下载大小:330831956字节
- 数据集大小:664635976字节



