five

Data from: Nonlandmark classification in paleobiology: computational geometry as a tool for species discrimination

收藏
DataONE2016-05-17 更新2024-06-26 收录
下载链接:
https://search.dataone.org/view/null
下载链接
链接失效反馈
资源简介:
One important and sometimes contentious challenge in paleobiology is discriminating between species, which is increasingly accomplished by comparing specimen shape. While lengths and proportions are needed to achieve this task, finer geometric information, such as concavity, convexity, and curvature, plays a crucial role in the undertaking. Nonetheless, standard morphometric methodologies such as landmark analysis are not able to capture in a quantitative way these features and other important fine-scale geometric notions. Here we develop and implement state-of-the-art techniques from the emerging field of computational geometry to tackle this problem with the Mississippian blastoid Pentremites. We adapt previously known computational framework to produce a measure of dissimilarity between shapes. More precisely, we compute “distances” between pairs of 3D surface scans of specimens by comparing a mix of global and fine-scale geometric measurements. This process uses the 3D scan of a specimen as a whole piece of data incorporating complete geometric information about the shape; as a result, scans used must accurately reflect the geometry of whole, undamaged, undeformed specimens. Using this information we are able to represent these data in clusters, and ultimately reproduce and refine results obtained in previous work on species discrimination. Our methodology is landmark-free, and therefore faster and less prone to human error than previous landmark-based methodologies.
创建时间:
2016-05-17
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心 收录

MRMR

MRMR是一个专家级的多学科多模态检索基准,包含1502个经过人类专家仔细验证的查询,涵盖了23个领域。与之前的基准相比,MRMR在三个关键方面取得了进步:首先,它挑战了跨多个专业领域的检索系统,能够在不同领域之间进行细粒度的模型比较;其次,查询是推理密集型的,需要更深入地解释图像,例如诊断显微镜幻灯片;此外,还引入了矛盾检索这一新型任务,要求模型识别冲突的概念。与仅限于单个图像或单模态文档的早期基准不同,MRMR提供了一个具有多图像查询和混合模态语料库文档的现实场景。

arXiv 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录

CMU-MOSI

CMU-MOSI数据集包括了从93个YouTube的视频中获取的2199个独白类型的短视频片段。每个片段都是一个独立的多模态示例,其中图像、文本和音频占比是均匀的,情感分数取值为[-3,+3],表示从强负向到强正向情感。

DataCite Commons 收录