five

ceramica-morfologia

收藏
Hugging Face2026-05-10 更新2026-05-11 收录
下载链接:
https://huggingface.co/datasets/kboliveira/ceramica-morfologia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“形态学陶瓷”,是一个用于自动化形态学分类的考古陶瓷容器图像数据集,由巴西皮奥伊联邦大学(UFPI)的考古与技术研究实验室(LATEC)开发。数据集包含1,000至10,000张图像,主要用于多类别图像分类任务,特别适用于考古学领域,尤其是巴西考古学和图皮陶瓷研究。数据集中的陶瓷容器被分为五个类别:盘子(prato)、碗(tigela)、锅(panela)、罐(pote)和其他(outro),每种类别都有其形态和功能描述。图像来源于开放资源和公共领域,包括大都会艺术博物馆、维基共享资源、Europeana和DuckDuckGo Images等。数据集结构包括原始图像文件夹(raw/)和收集清单文件(coleta_manifest.csv),后者记录了每张图像的来源、URL、许可证和标题等信息。数据集采用CC-BY-4.0许可,使用时需按照提供的引用格式进行引用。

The dataset is named Morphological Ceramics and is an image dataset of archaeological ceramic containers designed for automated morphological classification, developed by the Laboratory of Archaeological and Technological Research (LATEC) at the Federal University of Piauí (UFPI) in Brazil. It contains between 1,000 and 10,000 images, primarily intended for multi-class image classification tasks, with specific applications in archaeology, particularly Brazilian archaeology and Tupi ceramic studies. The ceramic containers in the dataset are categorized into five classes: plate (prato), bowl (tigela), pot (panela), jar (pote), and other (outro), each with descriptions of their morphology and function. Images are sourced from open resources and the public domain, including the Metropolitan Museum of Art, Wikimedia Commons, Europeana, and DuckDuckGo Images. The dataset structure includes a raw image folder (raw/) and a collection manifest file (coleta_manifest.csv), which records information such as the source, URL, license, and title for each image. The dataset is licensed under CC-BY-4.0, and users are required to cite it according to the provided citation format.
创建时间:
2026-05-09
原始信息汇总

数据集概述

Cerâmica Morfológica 是一个用于考古陶瓷容器形态自动分类的图像数据集,由巴西皮奥伊联邦大学考古与技术研究实验室(LATEC/UFPI)开发。

基本信息

  • 语言:葡萄牙语、英语
  • 许可证:Creative Commons Attribution 4.0 International (CC BY 4.0)
  • 任务类型:多类别图像分类
  • 样本规模:1,000 < 样本数 < 10,000
  • 标签:考古学、陶瓷、陶器、巴西考古学、图皮文化、形态分类

数据类别

数据集包含5种形态功能类别:

类别 描述
prato(盘) 浅而宽的开口容器,用于盛放食物
tigela(碗) 半球形开口容器,用于一般饮食
panela(锅) 烹饪用容器,通常口径受限
pote(罐) 带颈的高身储存容器
outro(其他) 不属于上述类别的形状

数据来源

图像来源于开放及公共领域资源:

  • 大都会艺术博物馆(CC0 公共领域)
  • 维基共享资源(许可证各异,详见 coleta_manifest.csv
  • Europeana(开放许可证)
  • DuckDuckGo 图像搜索(许可证各异)

数据集结构

raw/ # 原始图像(JPG格式) coleta_manifest.csv # 图像追踪文件:包含来源、URL、许可证、标题

使用方式

可通过 Hugging Face Hub 下载数据集: python from huggingface_hub import snapshot_download

snapshot_download( repo_id="SEU_USUARIO/ceramica-morfologia", repo_type="dataset", local_dir="data", allow_patterns=["raw/*", "coleta_manifest.csv"], )

相关研究

该数据集基于以下研究的扩展方法论:

OLIVEIRA, Karla Bianca da Silva; CORRÊA, Ângelo Alves; SILVA, Fabiola Andrea. Classificação morfológica automatizada em cerâmicas Asurini do Xingu. Revista de Arqueologia, v. 36, n. 1, p. 170–183, 2023. DOI: https://doi.org/10.24885/sab.v36i1.1028

引用方式

bibtex @dataset{oliveira2024ceramica, author = {Oliveira, Karla Bianca da Silva}, title = {Cerâmica Morfológica: Dataset de Vasilhas Cerâmicas Arqueológicas}, year = {2024}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/SEU_USUARIO/ceramica-morfologia} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由LATEC/UFPI(皮奥伊联邦大学考古学与技术研究实验室)倾力构建,旨在推动考古陶瓷器皿形态分析的自动化进程。研究人员从纽约大都会艺术博物馆、维基共享资源、Europeana及DuckDuckGo图像搜索等开放与公共领域平台,精心采集了涵盖巴西亚马逊盆地图皮族文化特色的原始陶瓷图像,并以JPG格式存储于`raw/`文件夹中。每一张图像均通过`coleta_manifest.csv`清单文件详细追溯其来源、URL、许可证及标题,确保数据来源合法且可溯源。数据集共包含5个形态-功能类别:prato(浅盘)、tigela(碗)、panela(锅)、pote(罐)及outro(其他),为多类别图像分类任务奠定了坚实基础。
特点
该数据集的核心特色在于其聚焦考古陶器形态分类的专业性与可扩展性。图像素材全部源自知名机构的公开域与开放许可资源,既保障了知识产权的合规性,又体现了跨文化、跨地域的丰富多样性。分类体系基于Bianca等人2023年发表于《Revista de Arqueologia》的研究方法论,将陶瓷器皿按形态与功能精细划分为四类典型形状及一个杂项类别,实现了由视觉特征到功能语义的映射。此外,配套的`coleta_manifest.csv`文件为每张图像提供了完整的元数据追踪,极大增强了数据的透明度与可复现性,便于研究者在不同学术场景下进行验证与扩展。
使用方法
使用者可通过Hugging Face Hub便捷获取该数据集。推荐采用`huggingface_hub`库中的`snapshot_download`函数,指定仓库标识符为`SEU_USUARIO/ceramica-morfologia`,设置`repo_type='dataset'`,并将`local_dir`参数指向本地存储路径。利用`allow_patterns`参数可精准筛选`raw/*`目录下的原始图像与`coleta_manifest.csv`清单文件。下载后,配合Python的深度学习框架(如PyTorch或TensorFlow),即可加载图像数据进行多类别分类模型的训练或微调。研究者在发表成果时,应引用OLIVEIRA等人2024年的相关数据集文献,以尊重原创作者的智力贡献。
背景与挑战
背景概述
该数据集由巴西皮奥伊联邦大学(UFPI)考古学与技术研究实验室(LATEC)的Karla Bianca da Silva Oliveira等人于2024年创建,旨在推动考古陶瓷器皿形态分类的自动化进程。其核心研究问题源于计算机视觉与机器学习在考古学中的交叉应用,延续了团队在Asurini do Xingu陶瓷形态自动分类方面的前期工作(2023年发表于《Revista de Arqueologia》)。数据集收录了来自大都会艺术博物馆、维基共享资源等开放平台的上千张图像,涵盖碗、盘、罐、锅等五类形态功能类别,为巴西考古学中陶瓷器皿的智能识别与分类研究提供了标准化的标注资源,对促进南美土著考古研究的数字化方法具有重要影响。
当前挑战
该数据集所应对的领域挑战在于,传统考古陶瓷形态分类高度依赖专家经验,耗时费力且主观性强,而现有公开数据集多聚焦于欧亚或地中海区域,缺乏针对巴西考古语境中Tupi等土著文化的标注图像库。构建过程中面临多重困难:图像来源分散于多个开放平台,需逐一审核许可协议并维护溯源清单;部分图像因拍摄角度、光照差异或破损状态导致形态特征模糊,增加了标注噪声;五类分类体系虽简化了形态复杂性,但“其他”类的界定标准需在专家体系中反复校准,以避免类别间边界模糊。此外,数据集规模有限(1K-10K),限制了深度学习模型的泛化能力。
常用场景
经典使用场景
在考古学与计算机视觉的交叉领域中,ceramica-morfologia数据集为古代陶器形态的自动化分类提供了标准化的视觉资源。该数据集收录了来自大都会艺术博物馆、维基共享资源等公开来源的千余张陶瓷容器图像,并依据形态功能学原则划分为‘盘’、‘碗’、‘锅’、‘罐’及‘其他’五大类别。研究者可借助深度学习模型,基于图像特征对陶器轮廓、口沿与器身比例等形态指标进行自动判别,从而替代传统依赖考古学家经验的人工分类流程。这一场景不仅显著提升了分类效率,更使得大规模遗址出土陶器的系统性整理成为可能,为南美考古,特别是图皮文化陶瓷研究注入了新的方法论活力。
衍生相关工作
基于ceramica-morfologia数据集,研究者已衍生出多项重要工作。其中最具代表性的是Oliveira等人(2023)发表的‘阿苏里尼-欣古陶瓷自动化形态分类’研究,该工作以巴西亚马逊地区的阿苏里尼陶器为案例,验证了卷积神经网络在有限样本下对陶器形状进行功能性区分的可行性。此外,LATEC/UFPI团队正进一步探索迁移学习与数据增强技术,以期将本数据集训练的模型适配至其他南美史前文化陶器的分类任务中。未来,该数据集有望成为拉丁美洲数字考古基准库的基石,激发诸如陶器纹饰与形态的联合分析、以及基于三维扫描的多视角分类等相关研究,持续推动技术与人文的交汇创新。
数据集最近研究
最新研究方向
在考古学与计算机科学的交叉领域,ceramica-morfologia数据集为巴西陶器形态自动分类提供了关键的基准资源。当前研究聚焦于利用深度卷积神经网络对Tupi传统陶瓷器皿(如盘、碗、罐、锅)进行高精度形态识别,以替代传统人工分类的主观性与低效性。该数据集与Asurini do Xingu陶器分类研究一脉相承,推动了考古类型学的数字化革新,尤其在南美原住民物质文化研究中具有里程碑意义。其多源开放图像(来自大都会博物馆、维基共享等)与CC-4.0许可,促进了可重复性科学实践,为跨文化陶瓷比较分析奠定了数据基础,正引领着低成本、低资源情境下考古计算机视觉的前沿探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作