five

liswei/NTU-Tree

收藏
Hugging Face2023-04-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/liswei/NTU-Tree
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': araucaria_excelsa '1': chinese_fan_palm '2': chinese_hackberry '3': chinese_tallow_tree '4': comphor_tree '5': formosan_sweet_gum '6': honduras_mahogany '7': hoop_pine '8': indian_walnut '9': indigenous_cinnamon_tree '10': macaranga '11': marabutan '12': royal_palm '13': silk_floss_tree '14': white_barkfig splits: - name: train num_bytes: 720396640 num_examples: 224 - name: test num_bytes: 429531935 num_examples: 132 - name: validation num_bytes: 406231409 num_examples: 122 download_size: 1554491709 dataset_size: 1556159984 task_categories: - image-classification tags: - biology pretty_name: NTU-Stem size_categories: - n<1K license: cc-by-nc-4.0 --- # Dataset Card for "NTU-Stem" ![sample](sample.png) The NTU Tree Dataset is a high-resolution few-shot learning dataset of the stem images of 15 different tree species found in the National Taiwan University (NTU) campus. The dataset was collected using personal cellphones in an effort to increase familiarity with the campus’s natural beauty. The dataset includes images of the stem of the following 15 tree species, along with their Chinese and English names: | 中文名稱 | English Name | |--------------|--------------------------| | 大王椰子 | Royal Palm | | 土肉桂 | Indigenous Cinnamon Tree | | 大葉桃花心木 | Honduras Mahogany | | 小葉南洋杉 | Araucaria Excelsa | | 石栗 | Indian Walnut | | 朴樹 | Chinese Hackberry | | 血桐 | Macaranga | | 垂榕 | White Barkfig | | 肯氏南洋杉 | Hoop Pine | | 美人樹 | Floss-silk Tree | | 烏桕 | Chinese Tallow Tree | | 楓香 | Formosan Sweet Gum | | 榕樹 | Marabutan | | 蒲葵 | Chinese Fan Palm | | 樟樹 | Comphor Tree | The dataset contains a total of 240 images, with each species class containing 8 to 16 training images and the remaining 8 to 10 images serving as test data. The images were captured at a resolution of approximately 3k x 3k pixels, providing high detail for the purpose of few-shot learning. ## Acknowledgements This dataset was collected by the following students of National Taiwan University in Graduate Institute of Networking and Multimedia (GINM) and the Department of Computer Science and Information Engineering (CSIE). Thanks to [@liswei](https://huggingface.co/liswei), [@roger0426](https://huggingface.co/roger0426), [@CYLiao1127](https://github.com/CYLiao1127), and [@j1u2l3i4a5n](https://github.com/j1u2l3i4a5n) for collecting the dataset.

数据集信息: 特征: - 名称:image,数据类型:图像 - 名称:label,数据类型:类别标签,类别名称: '0': 小叶南洋杉(Araucaria Excelsa) '1': 蒲葵(Chinese Fan Palm) '2': 朴树(Chinese Hackberry) '3': 乌桕(Chinese Tallow Tree) '4': 樟树(Comphor Tree) '5': 枫香(Formosan Sweet Gum) '6': 大叶桃花心木(Honduras Mahogany) '7': 肯氏南洋杉(Hoop Pine) '8': 石栗(Indian Walnut) '9': 土肉桂(Indigenous Cinnamon Tree) '10': 血桐(Macaranga) '11': 榕树(Marabutan) '12': 大王椰子(Royal Palm) '13': 美人树(Silk Floss Tree) '14': 垂榕(White Barkfig) 划分: - 划分名称:训练集(train),字节数:720396640,样本数:224 - 划分名称:测试集(test),字节数:429531935,样本数:132 - 划分名称:验证集(validation),字节数:406231409,样本数:122 下载大小:1554491709 字节 数据集总大小:1556159984 字节 任务类别: - 图像分类(image-classification) 标签: - 生物学(biology) 数据集展示名称:NTU-Stem 样本规模类别: - 样本数少于1000 许可协议:CC BY-NC 4.0 ## 「NTU-Stem」数据集卡片 ![样本图像](sample.png) 本NTU树木数据集是针对中国台湾大学校园内15种不同树木的茎干图像构建的高分辨率少样本学习(Few-shot Learning)数据集。本数据集通过个人手机采集完成,旨在增进人们对校园自然景观的了解与熟悉度。 本数据集涵盖以下15种树木的茎干图像,并附带其中文与英文名称: | 中文名称 | 英文名称 | |----------|--------------------------| | 大王椰子 | Royal Palm | | 土肉桂 | Indigenous Cinnamon Tree | | 大叶桃花心木 | Honduras Mahogany | | 小叶南洋杉 | Araucaria Excelsa | | 石栗 | Indian Walnut | | 朴树 | Chinese Hackberry | | 血桐 | Macaranga | | 垂榕 | White Barkfig | | 肯氏南洋杉 | Hoop Pine | | 美人树 | Floss-silk Tree | | 乌桕 | Chinese Tallow Tree | | 枫香 | Formosan Sweet Gum | | 榕树 | Marabutan | | 蒲葵 | Chinese Fan Palm | | 樟树 | Comphor Tree | 本数据集总计包含240张图像,每个物种类别包含8至16张训练样本,剩余8至10张作为测试样本。所有图像均以约3000×3000像素的分辨率采集,可为少样本学习任务提供丰富的细节信息。 ## 致谢 本数据集由中国台湾大学网络与多媒体研究所(Graduate Institute of Networking and Multimedia,简称GINM)及计算机科学与信息工程系(Department of Computer Science and Information Engineering,简称CSIE)的以下学生采集完成。 感谢[@liswei](https://huggingface.co/liswei)、[@roger0426](https://huggingface.co/roger0426)、[@CYLiao1127](https://github.com/CYLiao1127)以及[@j1u2l3i4a5n](https://github.com/j1u2l3i4a5n)参与本数据集的采集工作。
提供机构:
liswei
原始信息汇总

数据集概述

数据集名称

  • 名称: NTU-Stem
  • 别名: NTU Tree Dataset

数据集内容

  • 类型: 图像分类
  • 特征:
    • image: 图像数据
    • label: 类别标签,包含15个类别,每个类别对应一个树种
  • 树种列表:
    • araucaria_excelsa
    • chinese_fan_palm
    • chinese_hackberry
    • chinese_tallow_tree
    • comphor_tree
    • formosan_sweet_gum
    • honduras_mahogany
    • hoop_pine
    • indian_walnut
    • indigenous_cinnamon_tree
    • macaranga
    • marabutan
    • royal_palm
    • silk_floss_tree
    • white_barkfig

数据集划分

  • 训练集: 224个样本,占用720396640字节
  • 测试集: 132个样本,占用429531935字节
  • 验证集: 122个样本,占用406231409字节

数据集大小

  • 下载大小: 1554491709字节
  • 数据集大小: 1556159984字节

任务与标签

  • 任务类别: 图像分类
  • 标签详情: 每个类别标签对应一个树种的名称

数据集属性

  • 标签数量: 15
  • 图像分辨率: 约3k x 3k像素
  • 总图像数量: 240张

许可证

  • 许可证: cc-by-nc-4.0

数据集来源

  • 收集地点: 国立台湾大学校园
  • 收集方式: 使用个人手机拍摄
  • 目的: 增进对校园自然美景的熟悉度

数据集贡献者

搜集汇总
数据集介绍
main_image_url
构建方式
在植物学与计算机视觉交叉领域,NTU-Tree数据集的构建体现了对校园生物多样性的系统性记录。该数据集通过个人移动设备采集,聚焦于台湾大学校园内15种不同树种的茎干图像,每张图像分辨率高达约3000×3000像素,确保了细节的丰富性。数据采集过程遵循严格的物种分类标准,每种树种包含8至16张训练图像及8至10张测试图像,总计240张高分辨率样本,旨在为少样本学习任务提供高质量视觉数据。这种构建方式不仅提升了数据集的实用性,也为生态研究提供了可扩展的数字化基础。
特点
NTU-Tree数据集的核心特点在于其专注于少样本学习场景下的高分辨率茎干图像分类。数据集涵盖15种校园常见树种,每类样本数量有限但图像细节极为丰富,能够有效模拟真实世界中数据稀缺的植物识别挑战。图像均以统一的高分辨率格式存储,确保了形态特征的清晰可辨,同时标注信息包含中英文物种名称,增强了跨语言研究的便利性。这一设计使得数据集在推动细粒度植物分类模型发展的同时,也为生态多样性研究提供了精准的视觉参考。
使用方法
该数据集适用于图像分类任务,尤其适合少样本学习与迁移学习的研究场景。用户可通过HuggingFace平台直接加载数据,利用预划分的训练、验证与测试集进行模型训练与评估。在实际应用中,研究者可基于高分辨率图像开发深度学习模型,以识别不同树种的茎干特征,亦可结合数据增强技术缓解样本量有限的挑战。数据集遵循CC-BY-NC-4.0许可协议,允许非商业用途下的自由使用与修改,为学术探索提供了灵活且可靠的基础资源。
背景与挑战
背景概述
在计算机视觉与植物学交叉领域,树种的精准识别对于生态监测、生物多样性保护及城市绿化管理具有重要价值。NTU-Tree数据集由台湾大学网络与多媒体研究所及资讯工程学系的研究团队于近年创建,专注于校园内15种树木茎干图像的高分辨率采集。该数据集的核心研究问题在于探索小样本学习范式下的树种分类能力,旨在通过有限标注数据训练鲁棒的视觉模型,以提升自然场景中植物识别的自动化水平。其高质量图像与精细标注为植物图像分析领域提供了宝贵资源,推动了细粒度分类与少样本学习技术的发展。
当前挑战
NTU-Tree数据集旨在解决树木种类自动识别这一领域问题,其挑战主要源于树种间视觉特征的细微差异,如树皮纹理、颜色与形态的高度相似性,这对模型的判别能力提出了严峻考验。在构建过程中,研究团队面临采集环境光照不均、背景干扰复杂以及图像分辨率极高导致的数据处理与标注成本攀升等难题。此外,每类样本数量有限且分布不均衡,进一步加剧了模型在小样本条件下泛化性能的优化难度,要求算法具备更强的特征提取与迁移学习能力。
常用场景
经典使用场景
在植物学与计算机视觉交叉领域,NTU-Tree数据集以其高分辨率树干图像,为少样本学习任务提供了经典范例。该数据集聚焦于台湾大学校园内15种树木的树干特征,通过精细标注的类别标签,支持模型在有限样本下进行图像分类训练。其高像素细节捕捉了树皮纹理、颜色与形态的细微差异,使得研究者能够探索在数据稀缺场景下,如何提升模型对自然物体识别的泛化能力与鲁棒性。
解决学术问题
该数据集有效应对了少样本学习在生态学图像识别中的核心挑战,即如何在样本量有限条件下实现精准物种分类。它为解决模型过拟合、特征提取不充分等学术问题提供了实证基础,推动了迁移学习、元学习等方法在植物识别领域的应用。其意义在于弥合了计算机视觉技术与生物多样性监测之间的鸿沟,为自动化树种鉴定系统的开发奠定了数据基石,促进了跨学科研究的深度融合。
衍生相关工作
基于NTU-Tree数据集,研究者已衍生出一系列经典工作,包括少样本图像分类算法的优化、基于注意力机制的树干特征提取模型,以及跨域迁移学习在植物识别中的适应性研究。这些工作不仅提升了数据集在学术界的知名度,还推动了类似生态图像数据集的构建标准,为后续如细粒度植物分类、野外自动监测等方向提供了方法论参考与比较基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作