five

Supernova

收藏
魔搭社区2025-12-05 更新2025-07-12 收录
下载链接:
https://modelscope.cn/datasets/sequelbox/Supernova
下载链接
链接失效反馈
官方服务:
资源简介:
**Supernova** is a dataset containing general synthetic chat data from the best available open-source models. The **2024-09-27** version contains: - 178.2k rows of synthetic chat responses generated using [Llama 3.1 405b Instruct.](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct) - 47k UltraChat prompts from [HuggingFaceH4/ultrafeedback_binarized](https://huggingface.co/datasets/HuggingFaceH4/ultrafeedback_binarized) - 131k SlimOrca prompts from [Open-Orca/slimorca-deduped-cleaned-corrected](https://huggingface.co/datasets/Open-Orca/slimorca-deduped-cleaned-corrected) This dataset contains synthetically generated data and has not been subject to manual review.

**Supernova** 是一款收录了当前最优开源模型生成的通用合成对话数据(synthetic chat data)的数据集。 其**2024-09-27**版本包含如下内容: - 178.2千条合成对话回复,由 [Llama 3.1 405B Instruct](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct) 生成: - 47千条 UltraChat 提示词,源自数据集 [HuggingFaceH4/ultrafeedback_binarized](https://huggingface.co/datasets/HuggingFaceH4/ultrafeedback_binarized) - 131千条 SlimOrca 提示词,源自数据集 [Open-Orca/slimorca-deduped-cleaned-corrected](https://huggingface.co/datasets/Open-Orca/slimorca-deduped-cleaned-corrected) 该数据集仅包含合成生成的数据,未经过人工审核。
提供机构:
maas
创建时间:
2025-07-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作