five

Celestia

收藏
魔搭社区2025-12-05 更新2025-07-12 收录
下载链接:
https://modelscope.cn/datasets/sequelbox/Celestia
下载链接
链接失效反馈
官方服务:
资源简介:
**Celestia** is a dataset containing science-instruct data. The **2024-10-30** version contains: - 126k rows of synthetic science-instruct data, using synthetically generated prompts and responses generated using [Llama 3.1 405b Instruct.](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct) Primary subjects are physics, chemistry, biology, and computer science; secondary subjects include Earth science, astronomy, and information theory. This dataset contains synthetically generated data and has not been subject to manual review.

**Celestia** 是一款收录科学指令类数据的数据集。 其**2024-10-30**版本包含如下内容: - 12.6万行合成科学指令数据,所用提示词与应答文本均由[Llama 3.1 405b Instruct](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct)生成。该数据集的核心学科涵盖物理学、化学、生物学与计算机科学,次要学科包括地球科学、天文学与信息论。 本数据集所收录数据均为合成生成数据,尚未经过人工审核。
提供机构:
maas
创建时间:
2025-07-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作