openchat/openchat_sharegpt_v3
收藏Hugging Face2023-09-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/openchat/openchat_sharegpt_v3
下载链接
链接失效反馈官方服务:
资源简介:
ShareGPT数据集用于训练OpenChat V3系列模型。数据集包括原始格式的Markdown转换版本、特定模型标签(如GPT-4)的数据子集,以及预处理的tokenized数据集。需要注意的是,该数据集目前不兼容HuggingFace的数据加载器。
ShareGPT数据集用于训练OpenChat V3系列模型。数据集包括原始格式的Markdown转换版本、特定模型标签(如GPT-4)的数据子集,以及预处理的tokenized数据集。需要注意的是,该数据集目前不兼容HuggingFace的数据加载器。
提供机构:
openchat
原始信息汇总
数据集概述
数据集名称
ShareGPT
数据集用途
用于训练OpenChat V3系列。
数据集内容
sharegpt_clean.json: ShareGPT数据集的原始格式,转换为Markdown,并带有model标签。sharegpt_gpt4.json:sharegpt_clean.json中所有model == "Model: GPT-4"的实例。*.parquet: 预先分词的数据集,用于训练指定版本的OpenChat。
许可证
MIT
兼容性说明
该数据集目前不兼容HF数据集加载器。



