MikeTrizna/bees
收藏数据集卡片 - 蜜蜂数据集
数据集概述
美国国家自然历史博物馆(USNM)的熊蜂数据集是一个自然历史数据集,包含73,497个熊蜂标本的家庭Apidae的单个侧面或背面的图像以及包含出现数据的制表符分隔值文件。出现数据包括物种分类、采集日期和地点/位置以及其他符合达尔文核心数据标准(https://dwc.tdwg.org)的元数据。11,421个标本未鉴定到物种,这些标本被列为Bombus sp.或Xylocopa sp.。大多数标本(55,301个)的采集地点/位置已经地理参考。该数据集是全球范围的,但仅限于史密森尼USNM收藏中的标本。
语言
英语
数据实例
一个典型的数据点包含单个熊蜂标本的标本元数据和图像信息。
数据集中的一个示例如下:
json { "occurrenceID": "http://n2t.net/ark:/65665/30042e2d8-669d-4520-b456-e3c64203eff8", "catalogNumber": "USNMENT01732649", "recordedBy": "R. Craig", "year": "1949", "month": "4", "day": "13", "country": "United States", "stateProvince": "California", "county": "Fresno", "locality": "Auberry", "decimalLatitude": "37.0808", "decimalLongitude": "-119.485", "identifiedBy": "OBrien, L. R.", "scientificName": "Xylocopa (Notoxylocopa) tabaniformis orpifex", "genus": "Xylocopa", "subgenus": "Notoxylocopa", "specificEpithet": "tabaniformis", "infraspecificEpithet": "orpifex", "scientificNameAuthorship": "Smith", "accessURI": "https://ids.si.edu/ids/deliveryService?id=NMNH-USNMENT01732649", "PixelXDimension": 2000, "PixelYDimension": 1212 }
数据字段
标本元数据字段符合达尔文核心数据标准,详细信息见:https://dwc.tdwg.org。图像元数据字段符合视听核心数据标准,详细信息见:https://ac.tdwg.org/。
数据集大小
- 训练集:73,387个样本,3,672,202,733.82字节
- 下载大小:3,659,907,058字节
- 数据集大小:3,672,202,733.82字节
配置
- 配置名称:default
- 数据文件:
- 分割:训练
- 路径:data/train-*
数据集管理者
史密森尼国家自然历史博物馆,昆虫学系。
Jessica Bird(昆虫学系数据经理)是数据集的主要联系人。
许可信息
公共领域,Creative Commons CC0。
引用信息
Orrell T, Informatics Office (2023). NMNH Extant Specimen Records (USNM, US). Version 1.72. National Museum of Natural History, Smithsonian Institution. Occurrence dataset. https://collections.nmnh.si.edu/ipt/resource?r=nmnh_extant_dwc-a&v=1.72




