Tree of life dataset|系统发育学数据集|生物多样性数据集
收藏Tree of life dataset 概述
数据集内容
- 数据类型:树状结构,即生命之树或系统发育树。
- 节点描述:每个节点代表地球上的一个物种(现存或已灭绝)。
- 链接描述:节点间的链接表示物种间的祖先/后代关系。
数据格式
- 原始数据:XML文件,位于
data
文件夹中的tolskeletaldumpUTF8.xml
。 - 转换格式:JSON和GraphML文件,同样位于
data
文件夹中。
数据处理
- 处理工具:Python脚本,提供为Jupyter笔记本
scripts/tree_of_life_xml_tol.ipynb
。 - 许可证:Apache 2.0。
数据集属性
- 节点属性:
- NAME:物种名称,未知时为空字符串。
- CONFIDENCE:置信度,0-自信,1-位置不确定,2-位置未指定。
- LEAF:是否为叶节点。
- CHILDCOUNT:子节点数量。
- PHYLESIS:系统发育状态,0-单系,1-单系不确定,2-非单系。
- HASPAGE:是否有描述该物种的网页。
- EXTINCT:物种状态,0-现存,2-已灭绝。
- ID:物种在树中的标识符。
- 链接属性:无。
数据集规模
- 物种数量:35960。
- 链接数量:35959。
许可证
- 原始XML文件:Attribution Creative Commons 3.0。
- 其他格式文件:同上,版权所有者为Benjamin Ricaud。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
望诊影像数据集及诊断文本数据集
中医望诊数据集包含舌诊图片3000张、面诊图片2000张、目诊图片3000张,舌诊图片的内容部分为舌头(属口颌系统),面诊图片的内容部分包括了面和唇(属其他系统)、眼睛部分做了脱敏处理,目诊图片的内容部分为眼睛(属感觉系统)。该数据集提供舌诊图像的齿痕、裂纹、点刺、苔色、胖瘦的标注信息;以及面诊图像的唇色、唇形、面神的标注信息;目诊图像的特征属性包括颜色名称、颜色HSL值、大小、特征出处。
国家人口健康科学数据中心 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录