OBI Component 20
收藏数据集概述
数据集名称
Component-Level OBI Retrieval
数据集描述
OBI Component 20 数据集包含20个常见的甲骨文组件。由于每个组件可以有不同的形式,我们选择了代表性的形式进行展示。
基于这些组件,我们从 小學堂 收集了11,335个甲骨文图像。经过 Prof. Pui-ling Tang 和 Ms. Peiying Zhang 的筛选,去除了不包含这20个选定组件的图像,最终保留了9,245个甲骨文图像。在这些图像中,Ms. Zhang 进一步标注了1,012个甲骨文图像中组件的具体位置,力求覆盖同一组件的不同形式。最终,OBI Component 20 数据集包含总共10,257个甲骨文图像,其中9,245个是甲骨文字符,1,012个是甲骨文组件。它们的分布如下表所示。
| 组件 | 字符数量 | 组件数量 | 组件 | 字符数量 | 组件数量 |
|---|---|---|---|---|---|
| 日 | 371 | 18 | 女 | 641 | 29 |
| 月 | 106 | 41 | 子 | 179 | 33 |
| 雨 | 152 | 17 | 目 | 422 | 31 |
| 阜 | 115 | 16 | 攴 | 414 | 91 |
| 水 | 622 | 41 | 止 | 1132 | 72 |
| 屮 | 267 | 14 | 衣 | 69 | 51 |
| 木 | 465 | 24 | 口 | 1592 | 42 |
| 犬 | 204 | 117 | 王 | 55 | 8 |
| 大 | 385 | 32 | 矢 | 383 | 32 |
| 人 | 1403 | 226 | 刀 | 268 | 77 |
数据集使用
如需使用此数据集,请通过电子邮件 cszkhu@comp.hkbu.edu.hk 提供以下信息,我们将在收到邮件后的5个工作日内提供数据集下载链接:
- 您的姓名,
- 您的机构,
- 数据集的预期用途,
- 声明确保不会将其用于商业盈利。
引用
@inproceedings{hu2024component, title={Component-Level Oracle Bone Inscription Retrieval}, author={Hu, Zhikai and Cheung, Yiu-ming and Zhang, Yonggang and Zhang, Peiying and Tang, Pui-ling}, booktitle={Proceedings of the 2024 International Conference on Multimedia Retrieval}, pages={647--656}, year={2024} }




