five

aeolian83/HuggingFaceH4-ultrachat_200k_filtered

收藏
Hugging Face2025-03-20 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/aeolian83/HuggingFaceH4-ultrachat_200k_filtered
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含对话信息,每个示例包括一个提示(prompt)、提示ID(prompt_id)以及一系列的消息(messages),每条消息包含内容(content)和角色(role)。数据集分为四个部分:训练集train_sft、测试集test_sft、训练集train_gen和测试集test_gen,分别包含不同数量的示例。总数据大小约为1.8GB。

The dataset contains conversation information, with each example including a prompt, a prompt ID, and a series of messages. Each message consists of content and a role. The dataset is divided into four parts: train_sft training set, test_sft test set, train_gen training set, and test_gen test set, each containing a different number of examples. The total dataset size is approximately 1.8GB.
提供机构:
aeolian83
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作