five

openchat/openchat_sharegpt_v3

收藏
Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/openchat/openchat_sharegpt_v3
下载链接
链接失效反馈
官方服务:
资源简介:
ShareGPT数据集用于训练OpenChat V3系列模型。数据集包括原始格式的Markdown转换版本、特定模型标签(如GPT-4)的数据子集,以及预处理的tokenized数据集。需要注意的是,该数据集目前不兼容HuggingFace的数据加载器。

ShareGPT数据集用于训练OpenChat V3系列模型。数据集包括原始格式的Markdown转换版本、特定模型标签(如GPT-4)的数据子集,以及预处理的tokenized数据集。需要注意的是,该数据集目前不兼容HuggingFace的数据加载器。
提供机构:
openchat
原始信息汇总

数据集概述

数据集名称

ShareGPT

数据集用途

用于训练OpenChat V3系列。

数据集内容

  • sharegpt_clean.json: ShareGPT数据集的原始格式,转换为Markdown,并带有model标签。
  • sharegpt_gpt4.json: sharegpt_clean.json中所有model == "Model: GPT-4"的实例。
  • *.parquet: 预先分词的数据集,用于训练指定版本的OpenChat。

许可证

MIT

兼容性说明

该数据集目前不兼容HF数据集加载器。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作