Chinese Ceramics Image Caption Dataset
收藏DataCite Commons2025-04-27 更新2025-05-18 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=a1e2750b72244908a2742ecbe548de80
下载链接
链接失效反馈官方服务:
资源简介:
In this dataset, image-text pairs of collection data were crawled from the official website of the British Museum with the keyword "ceramic" in China, and the English text was translated and refined. The wrong expression of vessel names, patterns and crafts was corrected, and the word order was adjusted to form the structure of "type - texture pattern - craft".The hand-sifted dataset contains a total of 4,096 image-text pairs, covering a variety of ceramic categories from the Stone Age to the recent past, such as teacups, dishes, statues, vases, and more.
本数据集以"陶瓷(ceramic)"为检索关键词,从大英博物馆(British Museum)官方网站爬取中国相关馆藏数据,获取原始图文对后,对其中的英文文本进行翻译与润色。期间修正了器物名称、纹样与工艺表述中的错误,并调整语序,构建为"品类-纹理纹样-工艺"的标准结构。经人工筛选后的本数据集共计包含4096组图文对,覆盖从石器时代至近现代的各类陶瓷品类,例如茶杯、盘碟、塑像、花瓶等。
提供机构:
Science Data Bank
创建时间:
2024-01-04
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个专注于中国陶瓷的图像-文本对数据集,包含4,096个样本,数据来源于英国博物馆官网。其特点在于文本描述经过翻译和精炼,并结构化为'类型 - 纹理图案 - 工艺'的格式,覆盖从石器时代到近代的多种陶瓷类别,如茶杯、盘子和花瓶等,适用于图像标注和陶瓷文化研究。
以上内容由遇见数据集搜集并总结生成



