Celestia
收藏魔搭社区2025-12-05 更新2025-07-12 收录
下载链接:
https://modelscope.cn/datasets/sequelbox/Celestia
下载链接
链接失效反馈官方服务:
资源简介:
**Celestia** is a dataset containing science-instruct data.
The **2024-10-30** version contains:
- 126k rows of synthetic science-instruct data, using synthetically generated prompts and responses generated using [Llama 3.1 405b Instruct.](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct) Primary subjects are physics, chemistry, biology, and computer science; secondary subjects include Earth science, astronomy, and information theory.
This dataset contains synthetically generated data and has not been subject to manual review.
**Celestia** 是一款收录科学指令类数据的数据集。
其**2024-10-30**版本包含如下内容:
- 12.6万行合成科学指令数据,所用提示词与应答文本均由[Llama 3.1 405b Instruct](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct)生成。该数据集的核心学科涵盖物理学、化学、生物学与计算机科学,次要学科包括地球科学、天文学与信息论。
本数据集所收录数据均为合成生成数据,尚未经过人工审核。
提供机构:
maas
创建时间:
2025-07-10



