ChaHu
收藏Hugging Face2025-11-24 更新2025-11-25 收录
下载链接:
https://huggingface.co/datasets/AGI-FBHC/ChaHu
下载链接
链接失效反馈官方服务:
资源简介:
中文数据集:包含紫砂壶图片、编号和中文器型分类信息。
创建时间:
2025-11-23
原始信息汇总
ChaHu数据集概述
数据集基本信息
- 语言:中文、英文
- 标签:紫砂壶、传统工艺、器型分类、图片数据集、yixing teapot、traditional craft、shape classification、image dataset
数据集配置
中文子集
- 配置名称:chinese
- 描述:中文数据集:包含紫砂壶图片、编号和中文器型分类信息
- 数据文件:
- 拆分:train
- 路径:ChaHu.csv
- 编码:GBK
- 特征列:
- 图片(字符串类型,使用图片URI)
- 图片号码(字符串类型)
- 几何形制类(字符串类型)
- 自然形制类(字符串类型)
- 花器(字符串类型)
- 提梁壶类(字符串类型)
- 创新与现代器型(字符串类型)
- 器型与文化寓意(字符串类型)
- 时间(字符串类型)
英文子集
- 配置名称:english
- 描述:English dataset: Contains Yixing teapot images, ID, and English shape classification information
- 数据文件:
- 拆分:train
- 路径:ChaHu_En.csv
- 编码:GBK
- 特征列:
- Image(字符串类型,使用图片URI)
- Image_Number(字符串类型)
- Geometric_Shape_Type(字符串类型)
- Natural_Shape_Type(字符串类型)
- Flower_Vessel(字符串类型)
- Lifting_Beam_Pot_Type(字符串类型)
- Innovative_Modern_Shape(字符串类型)
- Shape_and_Cultural_Implication(字符串类型)
- Time_Period(字符串类型)
搜集汇总
数据集介绍

构建方式
在传统工艺数字化保护背景下,ChaHu数据集通过系统采集紫砂壶实物图像构建而成。数据采集过程严格遵循文物数字化标准,采用高分辨率摄影技术记录器型细节,并由专业学者依据紫砂壶形制分类体系进行多维度标注。数据集采用CSV格式存储,包含中英文双版本配置,其中中文子集采用GBK编码确保汉字兼容性,每个样本均包含图像路径、编号及七类器型分类标签,形成完整的紫砂壶形制数字档案。
特点
该数据集最显著的特点是涵盖紫砂壶六大经典器型分类体系,包括几何形制、自然形制、花器、提梁壶等专业类别。每张图像均配备多维标签信息,既包含器型基础分类,也涉及文化寓意与时代背景等深层特征。数据集采用中英双语并行架构,既保留中文原生的专业术语体系,又通过精准翻译实现国际学术交流的便利性,为跨文化传统工艺研究提供标准化数据支撑。
使用方法
研究人员可通过HuggingFace平台直接加载数据集,利用标准数据加载器读取CSV文件及关联图像。在具体应用中,建议先根据研究目标选择中文或英文配置,通过图像路径字段调用高分辨率紫砂壶图片,结合器型分类标签进行视觉识别模型训练。对于文化研究场景,可联合分析器型分类与文化寓意字段,探索传统造物美学与时代特征的关联规律,实现工艺鉴定与文化遗产研究的协同推进。
背景与挑战
背景概述
紫砂壶作为中国传统工艺的瑰宝,其器型分类研究在文化遗产数字化领域具有重要价值。ChaHu数据集聚焦于紫砂壶器型的多维度分类,涵盖几何形制、自然形制、花器、提梁壶等典型类别,并融合时间维度与文化寓意特征。该数据集通过系统采集不同历史时期的紫砂壶图像,构建起中英文双版本的结构化数据,为传统工艺的计算机视觉研究提供了标准化基准。
当前挑战
紫砂壶器型分类面临形态多样性带来的特征提取难题,如自然形制中仿生结构的细微差异与几何形制的对称性要求。数据构建过程中需克服历史文物图像质量不均、跨时期器型演变脉络梳理等困难,同时需确保文化寓意标注的准确性与多语言标签的语义一致性。
常用场景
经典使用场景
在传统工艺数字化研究领域,ChaHu数据集为紫砂壶器型分类任务提供了标准化图像资源。该数据集通过几何形制、自然形制等七种分类维度,系统呈现了紫砂壶的形态特征,为计算机视觉算法在传统器物识别领域的应用奠定了数据基础。研究者可基于该数据集构建分类模型,实现紫砂壶器型的自动识别与归类。
实际应用
在博物馆数字化建设中,该数据集可辅助建立智能藏品管理系统,实现紫砂壶的快速分类与检索。艺术品交易平台借助其图像识别能力,可开发自动鉴证工具以辅助市场定价。教育机构则能基于数据集开发交互式教学系统,生动展示紫砂工艺的形制演变脉络。
衍生相关工作
基于该数据集衍生的经典研究包括多模态紫砂壶年代鉴定模型,通过融合器型特征与文化寓意实现断代分析。另有学者构建了跨语言器型知识图谱,将传统工艺术语转化为机器可理解的语义网络。在生成式人工智能领域,该数据集还催生了紫砂壶创新形制的自动设计系统。
以上内容由遇见数据集搜集并总结生成



