five

OttoYu/TreeHK40

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/OttoYu/TreeHK40
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - image-classification --- # AutoTrain Dataset for project: treehk ## Dataset Description This dataset has been automatically processed by AutoTrain for project treehk. ### Languages The BCP-47 code for the dataset's language is unk. ## Dataset Structure ### Data Instances A sample from this dataset looks as follows: ```json [ { "image": "<245x358 RGB PIL image>", "target": 0 }, { "image": "<400x530 RGB PIL image>", "target": 0 } ] ``` ### Dataset Fields The dataset has the following fields (also called "features"): ```json { "image": "Image(decode=True, id=None)", "target": "ClassLabel(names=['Acacia auriculiformis \u8033\u679c\u76f8\u601d', 'Acacia confusa Merr. \u53f0\u7063\u76f8\u601d', 'Acacia mangium Willd. \u5927\u8449\u76f8\u601d', 'Acronychia pedunculata (L.) Miq.--\u5c71\u6cb9\u67d1', 'Archontophoenix alexandrae \u4e9e\u529b\u5c71\u5927\u6930\u5b50', 'Bauhinia purpurea L. \u7d05\u82b1\u7f8a\u8e44\u7532', 'Bauhinia variegata L \u5bae\u7c89\u7f8a\u8e44\u7532', 'Bauhinia \u6d0b\u7d2b\u834a', 'Bischofia javanica Blume \u79cb\u6953', 'Bischofia polycarpa \u91cd\u967d\u6728', 'Callistemon rigidus R. Br \u7d05\u5343\u5c64', 'Callistemon viminalis \u4e32\u9322\u67f3', 'Cinnamomum burmannii \u9670\u9999', 'Cinnamomum camphora \u6a1f\u6a39', 'Crateva trifoliata \u920d\u8449\u9b5a\u6728 ', 'Crateva unilocularis \u6a39\u982d\u83dc', 'Delonix regia \u9cf3\u51f0\u6728', 'Elaeocarpus hainanensis Oliv \u6c34\u77f3\u6995', 'Elaeocarpus sylvestris \u5c71\u675c\u82f1', 'Erythrina variegata L. \u523a\u6850', 'Ficus altissima Blume \u9ad8\u5c71\u6995', 'Ficus benjamina L. \u5782\u8449\u6995', 'Ficus elastica Roxb. ex Hornem \u5370\u5ea6\u6995', 'Ficus microcarpa L. f \u7d30\u8449\u6995', 'Ficus religiosa L. \u83e9\u63d0\u6a39', 'Ficus rumphii Blume \u5047\u83e9\u63d0\u6a39', 'Ficus subpisocarpa Gagnep. \u7b46\u7ba1\u6995', 'Ficus variegata Blume \u9752\u679c\u6995', 'Ficus virens Aiton \u5927\u8449\u6995', 'Koelreuteria bipinnata Franch. \u8907\u7fbd\u8449\u6b12\u6a39', 'Livistona chinensis \u84b2\u8475', 'Melaleuca Cajeput-tree \u767d\u5343\u5c64 ', 'Melia azedarach L \u695d', 'Peltophorum pterocarpum \u76fe\u67f1\u6728', 'Peltophorum tonkinense \u9280\u73e0', 'Roystonea regia \u5927\u738b\u6930\u5b50', 'Schefflera actinophylla \u8f3b\u8449\u9d5d\u638c\u67f4', 'Schefflera heptaphylla \u9d5d\u638c\u67f4', 'Spathodea campanulata\u706b\u7130\u6a39', 'Sterculia lanceolata Cav. \u5047\u860b\u5a46', 'Wodyetia bifurcata A.K.Irvine \u72d0\u5c3e\u68d5'], id=None)" } ``` ### Dataset Splits This dataset is split into a train and validation split. The split sizes are as follow: | Split name | Num samples | | ------------ | ------------------- | | train | 385 | | valid | 113 |

任务类别: - 图像分类 # 项目treehk的AutoTrain数据集 ## 数据集说明 本数据集由AutoTrain针对treehk项目自动处理完成。 ### 语言信息 本数据集的语言BCP-47代码为unk(未知)。 ## 数据集结构 ### 数据实例 本数据集的样本示例如下: json [ { "图像": "<245×358 像素RGB PIL图像>", "目标": 0 }, { "图像": "<400×530 像素RGB PIL图像>", "目标": 0 } ] ### 数据集字段 本数据集包含以下字段(亦可称为特征): json { "图像": "图像(Image),解码参数为True,ID为空", "目标": "类别标签(ClassLabel),其类别名称包含:['Acacia auriculiformis 耳果相思', 'Acacia confusa Merr. 台湾相思', 'Acacia mangium Willd. 大叶相思', 'Acronychia pedunculata (L.) Miq.--山油柑', 'Archontophoenix alexandrae 亚历山大椰子', 'Bauhinia purpurea L. 紫花羊蹄甲', 'Bauhinia variegata L 粉花羊蹄甲', 'Bauhinia 洋紫荆', 'Bischofia javanica Blume 秋枫', 'Bischofia polycarpa 重阳木', 'Callistemon rigidus R. Br 红千层', 'Callistemon viminalis 垂枝红千层', 'Cinnamomum burmannii 阴香', 'Cinnamomum camphora 樟树', 'Crateva trifoliata 三脚鳖', 'Crateva unilocularis 鱼木', 'Delonix regia 凤凰木', 'Elaeocarpus hainanensis Oliv 海南杜英', 'Elaeocarpus sylvestris 山杜英', 'Erythrina variegata L. 刺桐', 'Ficus altissima Blume 高山榕', 'Ficus benjamina L. 垂叶榕', 'Ficus elastica Roxb. ex Hornem 印度橡皮树', 'Ficus microcarpa L. f 小叶榕', 'Ficus religiosa L. 菩提树', 'Ficus rumphii Blume 假菩提树', 'Ficus subpisocarpa Gagnep. 笔管榕', 'Ficus variegata Blume 杂色榕', 'Ficus virens Aiton 大叶榕', 'Koelreuteria bipinnata Franch. 复羽叶栾树', 'Livistona chinensis 蒲葵', 'Melaleuca Cajeput-tree 白千层', 'Melia azedarach L 楝树', 'Peltophorum pterocarpum 南洋楹', 'Peltophorum tonkinense 东京黄檀', 'Roystonea regia 大王椰子', 'Schefflera actinophylla 辐叶鹅掌柴', 'Schefflera heptaphylla 鹅掌柴', 'Spathodea campanulata 火焰树', 'Sterculia lanceolata Cav. 假苹婆', 'Wodyetia bifurcata A.K.Irvine 狐尾椰子'],ID为空" } ### 数据集划分 本数据集划分为训练集与验证集,各划分的样本规模如下: | 拆分名称 | 样本数量 | | -------- | -------- | | train | 385 | | valid | 113 |
提供机构:
OttoYu
原始信息汇总

数据集概述

数据集描述

本数据集是为项目“treehk”自动处理而生成的,主要涉及图像分类任务。

语言

数据集的语言代码为unk。

数据集结构

数据实例

数据集中的样本示例如下:

json [ { "image": "<245x358 RGB PIL image>", "target": 0 }, { "image": "<400x530 RGB PIL image>", "target": 0 } ]

数据集字段

数据集包含以下字段:

json { "image": "Image(decode=True, id=None)", "target": "ClassLabel(names=[Acacia auriculiformis u8033u679cu76f8u601d, Acacia confusa Merr. u53f0u7063u76f8u601d, Acacia mangium Willd. u5927u8449u76f8u601d, Acronychia pedunculata (L.) Miq.--u5c71u6cb9u67d1, Archontophoenix alexandrae u4e9eu529bu5c71u5927u5b50, Bauhinia purpurea L. u7d05u82b1u7f8au8e44u7532, Bauhinia variegata L u5baeu7c89u7f8au8e44u7532, Bauhinia u6d0bu7d2bu834a, Bischofia javanica Blume u79cbu6953, Bischofia polycarpa u91cdu967du6728, Callistemon rigidus R. Br u7d05u5343u5c64, Callistemon viminalis u4e32u9322u67f3, Cinnamomum burmannii u9670u9999, Cinnamomum camphora u6a1fu6a39, Crateva trifoliata u920du8449u9b5au6728 , Crateva unilocularis u6a39u982du83dc, Delonix regia u9cf3u51f0u6728, Elaeocarpus hainanensis Oliv u6c34u77f3u6995, Elaeocarpus sylvestris u5c71u675cu82f1, Erythrina variegata L. u523au6850, Ficus altissima Blume u9ad8u5c71u6995, Ficus benjamina L. u5782u8449u6995, Ficus elastica Roxb. ex Hornem u5370u5ea6u6995, Ficus microcarpa L. f u7d30u8449u6995, Ficus religiosa L. u83e9u63d0u6a39, Ficus rumphii Blume u5047u83e9u63d0u6a39, Ficus subpisocarpa Gagnep. u7b46u7ba1u6995, Ficus variegata Blume u9752u679cu6995, Ficus virens Aiton u5927u8449u6995, Koelreuteria bipinnata Franch. u8907u7fbdu8449u6b12u6a39, Livistona chinensis u84b2u8475, Melaleuca Cajeput-tree u767du5343u5c64 , Melia azedarach L u695d, Peltophorum pterocarpum u76feu67f1u6728, Peltophorum tonkinense u9280u73e0, Roystonea regia u5927u738bu6930u5b50, Schefflera actinophylla u8f3bu8449u9d5du638cu67f4, Schefflera heptaphylla u9d5du638cu67f4, Spathodea campanulatau706bu7130u6a39, Sterculia lanceolata Cav. u5047u860bu5a46, Wodyetia bifurcata A.K.Irvine u72d0u5c3eu68d5], id=None)" }

数据集分割

数据集被分割为训练集和验证集,分割大小如下:

分割名称 样本数量
训练集 385
验证集 113

此数据集适用于图像分类任务,包含多种植物图像及其对应的类别标签。

搜集汇总
数据集介绍
main_image_url
构建方式
在植物分类学与计算机视觉交叉领域,OttoYu/TreeHK40数据集通过系统化采集与标注流程构建而成。该数据集聚焦于香港地区常见的40种树木,每类样本均包含高分辨率RGB图像及对应的树种标签。构建过程中,研究者遵循严格的图像采集标准,确保样本在光照、角度及背景方面具有代表性,并采用专业植物分类学知识进行准确标注,为模型训练提供了可靠的多类别图像基础。
特点
本数据集的核心特点在于其专业性与地域针对性,涵盖了从相思树属到狐尾棕等40种香港典型树木的高质量图像。图像样本均以统一格式存储,标注体系采用中文学名与拉丁学名结合的方式,增强了数据的可读性与学术价值。数据集划分为训练集与验证集,样本数量分布合理,适用于图像分类任务的模型训练与评估,为区域树种识别研究提供了标准化资源。
使用方法
研究者可利用该数据集进行树木图像分类模型的开发与验证。使用前需加载图像数据及对应的类别标签,通过预处理步骤调整图像尺寸与格式,以适应深度学习框架的输入要求。数据集已预设训练与验证划分,用户可直接用于模型训练、超参数调优及性能评估,亦可通过迁移学习策略,基于该数据集微调预训练模型,以提升树种识别的准确性与泛化能力。
背景与挑战
背景概述
在植物分类学与生态监测领域,高精度树种识别对于生物多样性保护与城市绿化管理具有关键意义。OttoYu/TreeHK40数据集由相关研究团队于近期构建,聚焦于香港地区常见树种的图像分类任务。该数据集涵盖了40类本地树种,包括耳果相思、台湾相思、凤凰木等代表性物种,旨在通过计算机视觉技术实现自动化树种鉴别,以支持生态研究、林业资源调查及智慧城市建设。其创建为区域树种识别模型的训练与评估提供了标准化数据基础,推动了植物图像分析技术在特定地理环境下的应用发展。
当前挑战
该数据集致力于解决城市环境下树种图像自动分类的挑战,其核心难点在于同类树种形态相似度高、拍摄条件差异导致的图像光照与背景干扰,以及少数类别样本不足可能引发的模型偏差。在构建过程中,挑战主要集中于树种样本的采集与标注:需在自然场景中获取高质量且具有代表性的图像,并依赖植物学专家进行精确的物种鉴定,以确保标签的准确性。同时,数据需平衡类别分布与分割合理性,以支撑模型的有效训练与泛化性能评估。
常用场景
经典使用场景
在植物学与计算机视觉交叉领域,OttoYu/TreeHK40数据集为图像分类任务提供了关键资源。该数据集聚焦于香港地区40种常见树木的高质量图像,每一张图像均标注了精确的物种标签。其经典使用场景在于训练和评估深度学习模型,特别是卷积神经网络,以实现对复杂自然环境下的树木物种进行自动化、高精度的识别。这为生态研究中的大规模生物多样性监测奠定了技术基础。
解决学术问题
该数据集直接应对了细粒度图像分类的学术挑战。在生态信息学中,传统树木调查依赖专家目视鉴定,效率低下且主观性强。OttoYu/TreeHK40通过提供标准化的标注数据,使得研究人员能够开发算法,解决在姿态、光照、背景干扰下物种特征难以捕捉的问题。其意义在于推动了基于计算机视觉的植物分类方法从理论走向实践,为量化生态研究提供了可复现的基准。
衍生相关工作
围绕OttoYu/TreeHK40数据集,已衍生出一系列经典的学术工作。研究者们常以此作为基准,对比不同网络架构如ResNet、EfficientNet在植物分类任务上的性能。更进一步的工作则探索了迁移学习、数据增强以及注意力机制在该数据集上的应用,以提升模型在有限样本下的泛化能力。这些研究不仅优化了本地物种识别模型,其方法论也为处理其他区域的类似植物图像数据集提供了宝贵的参考范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作