five

2019年-中国-生物物种名录|生物多样性数据集|物种名录数据集

收藏
地球大数据科学工程2024-04-21 收录
生物多样性
物种名录
下载链接:
https://data.casearth.cn/sdo/detail/60e55fc9819aec59a2af7057
下载链接
链接失效反馈
资源简介:
生物多样性是国家重要的战略资源,是社会经济可持续发展中不可替代的物质基础。要保护生物多样性,建设生态文明,就必须了解中国有多少物种,有什么物种。从2008年开始,中国科学院组织100多位分类学专家,基于标本和文献,对我国已经发表的物种进行编目和研究,并以年度名录的形式每年更新,向社会公开发布,为全球使用者免费提供中国的动物、植物和菌物等生物类群的名称及分类分布信息。我国是世界上唯一一个每年发布年度生物物种名录的国家,《中国生物物种名录》也被国际物种2000编制的《全球生物物种名录》(Catalogue of Life)列为数据源,具有广泛的国内外影响力。《中国生物物种名录》严格按照国际物种2000的标准,收集和整理物种的分类学信息。在名录中,每个物种均包含拉丁学名、中文名、同物异名、别名、分布区、分类系统及相关文献的信息。每条数据都由分类学家审定确认,并与《全球生物物种名录》实现信息共享。《中国生物物种名录》2019版收录物种及种下单元突破10万个,达到106509个,其中物种94260个,种下单元12249个。
提供机构:
中国科学院
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

鄱阳湖流域主要水文站实时日水位观测数据集(2017-2024年)

该数据集为鄱阳湖流域主要水文站的逐日实时水位数据集。包含了外洲站、李家渡站、湖口站、星子站、万家埠站、都昌等10个主要水文站的日水位数据,观测时间为每日8:00。共享政策为一次可共享3000条数据,一个站点的一日数据为一条记录,一年可申请一次。 数据集包含1个excel表格文件,日水位.xlsx。

国家地球系统科学数据中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

中国区域教育数据库

该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。

www.moe.gov.cn 收录