mgoin/ultrachat_2k
收藏Hugging Face2024-05-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mgoin/ultrachat_2k
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含2048个样本的小数据集,来源于HuggingFaceH4/ultrachat_200k,用于简单的校准。数据集的特征包括prompt、prompt_id和messages,其中messages包含content和role两个子特征。数据集的分割为train_sft,包含2048个样本,总大小为13619808字节。
这是一个包含2048个样本的小数据集,来源于HuggingFaceH4/ultrachat_200k,用于简单的校准。数据集的特征包括prompt、prompt_id和messages,其中messages包含content和role两个子特征。数据集的分割为train_sft,包含2048个样本,总大小为13619808字节。
提供机构:
mgoin
原始信息汇总
数据集概述
数据集信息
- 名称: ultrachat_2k
- 来源: 从HuggingFaceH4/ultrachat_200k采样得到
- 样本数量: 2048
- 下载大小: 7145258字节
- 数据集大小: 13619808字节
数据集特征
- prompt: 数据类型为字符串
- prompt_id: 数据类型为字符串
- messages:
- content: 数据类型为字符串
- role: 数据类型为字符串
数据集分割
- train_sft:
- 字节数: 13619808
- 样本数: 2048
配置信息
- config_name: default
- data_files:
- split: train_sft
- path: data/train_sft-*



