b1ackrnoon/dunhuang
收藏Hugging Face2023-08-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/b1ackrnoon/dunhuang
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': animals
'1': architecture
'2': budd
'3': caption
'4': clothes
'5': dance
'6': doctrans
'7': fly
'8': folklore
'9': landscape
'10': music
'11': pattern
'12': sponsor
'13': story
'14': technique
'15': traffic
splits:
- name: train
num_bytes: 2715061712.664
num_examples: 2352
download_size: 2410606071
dataset_size: 2715061712.664
size_categories:
- 1K<n<10K
---
# Dataset Card for "dunhuang"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
configs:
- 配置名称(config_name): 默认(default)
data_files:
- split(数据子集): 训练子集(train)
path: data/train-*
dataset_info(数据集信息):
features(特征):
- name: 图像(image)
dtype: 图像(image)
- name: 标签(label)
dtype:
class_label(类别标签):
names(类别名称映射):
'0': 动物(animals)
'1': 建筑(architecture)
'2': budd
'3': 标题(caption)
'4': 服饰(clothes)
'5': 舞蹈(dance)
'6': 文档翻译(doctrans)
'7': fly
'8': 民俗(folklore)
'9': 风景(landscape)
'10': 音乐(music)
'11': 图案(pattern)
'12': 赞助(sponsor)
'13': 故事(story)
'14': 技术(technique)
'15': 交通(traffic)
splits(数据子集详情):
- name: 训练子集(train)
num_bytes: 2715061712.664
num_examples: 2352
download_size: 2410606071
dataset_size: 2715061712.664
size_categories(样本规模分类):
- 1000 < 样本数 < 10000
---
# 数据集卡片(Dataset Card):"敦煌(dunhuang)"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
b1ackrnoon
原始信息汇总
数据集概述
数据集名称
dunhuang
数据结构
-
配置信息:
- 默认配置 (
default)- 数据文件路径:
data/train-* - 分割类型:训练 (
train)
- 数据文件路径:
- 默认配置 (
-
数据特征:
- 图像 (
image)- 数据类型:图像
- 标签 (
label)- 数据类型:分类标签
- 类别名称:
- 0: animals
- 1: architecture
- 2: budd
- 3: caption
- 4: clothes
- 5: dance
- 6: doctrans
- 7: fly
- 8: folklore
- 9: landscape
- 10: music
- 11: pattern
- 12: sponsor
- 13: story
- 14: technique
- 15: traffic
- 类别名称:
- 数据类型:分类标签
- 图像 (
-
数据分割:
- 训练集 (
train)- 数据大小:2715061712.664 字节
- 示例数量:2352
- 训练集 (
数据集大小
- 下载大小:2410606071 字节
- 数据集总大小:2715061712.664 字节
数据集类别
- 大小范围:1K<n<10K
搜集汇总
数据集介绍

构建方式
敦煌数据集(b1ackrnoon/dunhuang)的构建基于对敦煌艺术与文化的深入挖掘,涵盖了丰富的图像数据。该数据集通过系统化的数据收集与标注流程,将图像数据分为16个类别,包括动物、建筑、佛教、服饰等。每一张图像均经过严格的筛选与分类,确保数据的多样性与代表性。数据集的构建过程注重细节,力求在保持数据质量的同时,充分展现敦煌文化的多元面貌。
特点
敦煌数据集的特点在于其广泛的类别覆盖与高质量的数据标注。数据集包含2352个样本,涵盖了敦煌艺术中的多个主题,如佛教、服饰、舞蹈等。每个样本均附有详细的类别标签,便于研究者进行多角度的分析与应用。此外,数据集的图像分辨率较高,能够为视觉研究提供丰富的细节信息。这种多样性与精细化的标注使得该数据集在敦煌文化研究领域具有重要的参考价值。
使用方法
敦煌数据集的使用方法灵活多样,适用于多种研究场景。研究者可以通过加载数据集中的图像与标签,进行图像分类、风格识别或文化分析等任务。数据集以标准化的格式存储,便于与主流深度学习框架(如PyTorch、TensorFlow)集成。此外,数据集的类别标签为多维度研究提供了便利,用户可根据需求选择特定类别进行深入分析。通过结合现代技术与传统文化,该数据集为敦煌艺术的数字化研究提供了重要支持。
背景与挑战
背景概述
敦煌数据集(b1ackrnoon/dunhuang)是一个专注于敦煌文化遗产的多类别图像数据集,涵盖了动物、建筑、佛教艺术、服饰、舞蹈、民间故事等多个主题。该数据集由b1ackrnoon团队创建,旨在通过数字化手段保存和传播敦煌文化的丰富内涵。敦煌作为丝绸之路上的重要节点,其文化遗产具有极高的历史与艺术价值。该数据集的构建不仅为研究者提供了丰富的视觉素材,还推动了文化遗产保护与数字人文研究的交叉融合。
当前挑战
敦煌数据集在构建过程中面临多重挑战。首先,敦煌文化的多样性与复杂性使得图像分类任务极具挑战性,尤其是佛教艺术与民间故事等类别的精细划分。其次,数据集的构建依赖于大量高质量的数字图像,而敦煌文物的保存状态与拍摄条件限制了数据的获取与标注。此外,敦煌文化的多语言与多文化背景也增加了数据标注的难度,尤其是在跨文化语境下的标签一致性问题上。这些挑战不仅影响了数据集的构建效率,也对后续的研究与应用提出了更高的要求。
常用场景
经典使用场景
在文化遗产数字化保护领域,b1ackrnoon/dunhuang数据集为研究者提供了一个丰富的图像资源库,涵盖了敦煌壁画中的动物、建筑、佛教艺术等多个类别。该数据集常用于训练深度学习模型,以自动识别和分类敦煌壁画中的不同主题,从而辅助文化遗产的数字化存档与研究。
解决学术问题
该数据集解决了文化遗产数字化过程中图像分类与标注的难题。通过提供高质量的标注图像,研究者能够开发出更精确的算法,用于自动识别敦煌壁画中的复杂图案和主题。这不仅提升了文化遗产保护的效率,还为艺术史研究提供了新的技术手段。
衍生相关工作
基于b1ackrnoon/dunhuang数据集,许多经典的研究工作得以展开。例如,研究者开发了基于深度学习的敦煌壁画风格迁移算法,能够将现代艺术风格与敦煌壁画相结合,创造出新的艺术形式。此外,该数据集还被用于生成敦煌壁画的3D重建模型,为文化遗产的虚拟展示提供了技术支持。
以上内容由遇见数据集搜集并总结生成



