james-burton/OrientalMuseum_min6-white-name
收藏Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/james-burton/OrientalMuseum_min6-white-name
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: obj_num
dtype: string
- name: file
dtype: string
- name: image
dtype: image
- name: root
dtype: string
- name: description
dtype: string
- name: label
dtype:
class_label:
names:
'0': Aegis
'1': Ajaeng Holder
'2': Album Painting
'3': Amulet Mould
'4': Animal Figurine
'5': Animal Mummy
'6': Animal bone
'7': Arm Guard
'8': Axe Head
'9': Axle-caps
'10': Ball
'11': Ballista Bolt
'12': Band
'13': Basin
'14': Baton
'15': Belt Hook
'16': Betel Nut Cutter
'17': Blouse
'18': Bolt
'19': Box
'20': Brush Pot
'21': Brush Rest
'22': Brush Tray
'23': Cabinet
'24': Cannon
'25': Cap
'26': Carved stone
'27': Case
'28': Cash Box
'29': Chest
'30': Cigar Holder
'31': Clapper
'32': Clay pipe (smoking)
'33': Comb
'34': Cosmetic and Medical Equipment and Implements
'35': Cricket pot
'36': Cross-bow Lock
'37': Cup And Saucer
'38': Cup, Saucer
'39': Cushion Cover
'40': DVDs
'41': Dagger
'42': Dice Box
'43': Dice Shaker
'44': Disc
'45': Domestic Equipment and Utensils
'46': Double Dagger
'47': Ear Protector
'48': Ear Stud
'49': Earring
'50': Erotic Figurine
'51': Eye Protector
'52': Figurine Mould
'53': Finger Ring
'54': Funerary Cone
'55': Funerary goods
'56': Funerary money
'57': Hand Jade
'58': Hand Protector
'59': Handwarmer
'60': Hanging
'61': Heart Scarab
'62': Human Figurine
'63': Incense Holder
'64': Inkstick
'65': Kite
'66': Knee Protector
'67': Kohl Pot
'68': Letter
'69': Lock
'70': Majiang set
'71': Manuscript Page
'72': Mat
'73': Mica Painting
'74': Miniature Painting
'75': Miniature Portrait
'76': Mortar
'77': Mould
'78': Mouth Jade
'79': Mouth Protector
'80': Mouth-piece
'81': Mummy Label
'82': Nail Protector
'83': Nose Protector
'84': Oracle Bone
'85': Ostraka
'86': Palette
'87': Panel
'88': Part
'89': Pelmet
'90': Pencase
'91': Pendant
'92': Perfumer
'93': Phylactery
'94': Pigstick
'95': Pipe
'96': Pipe Case
'97': Pipe Holder
'98': Pith Painting
'99': Plaque
'100': Plate
'101': Poh Kam
'102': Prayer Wheel
'103': Rank Square
'104': Rubber
'105': Sake Cup
'106': Scabbard Chape
'107': Scabbard Slide
'108': Scarab Seal
'109': Scarf
'110': Score Board
'111': Screen
'112': Seal
'113': Seal Paste Pot
'114': Shield
'115': Shroud Weight
'116': Sleeve Band
'117': Sleeve Weight
'118': Slide
'119': Soles
'120': Spillikins
'121': Staff Head
'122': Stamp
'123': Stand
'124': Stand of Incense Burner
'125': Stem Bowl
'126': Stem Cup
'127': Story Cloth
'128': Sword Guard
'129': Table
'130': Table Runner
'131': Thangka
'132': Tomb Figure
'133': Tomb Model
'134': Washer
'135': Water Dropper
'136': Water Pot
'137': Wine Pot
'138': Woodblock Print
'139': Writing Desk
'140': accessories
'141': adzes
'142': albums
'143': altar components
'144': amphorae
'145': amulets
'146': anchors
'147': animation cels
'148': animation drawings
'149': anklets
'150': armbands
'151': armor
'152': armrests
'153': arrowheads
'154': arrows
'155': autograph albums
'156': axes
'157': 'axes: woodworking tools'
'158': back scratchers
'159': badges
'160': bags
'161': bandages
'162': bangles
'163': banners
'164': baskets
'165': beads
'166': beakers
'167': bedspreads
'168': bells
'169': belts
'170': bezels
'171': blades
'172': board games
'173': boilers
'174': booklets
'175': books
'176': bottles
'177': bowls
'178': boxes
'179': bracelets
'180': bread
'181': brick
'182': brooches
'183': brush washers
'184': brushes
'185': buckets
'186': buckles
'187': business cards
'188': caddies
'189': calligraphy
'190': candelabras
'191': candleholders
'192': candlesticks
'193': canopic jars
'194': card cases
'195': cards
'196': carvings
'197': cases
'198': celestial globes
'199': censers
'200': chains
'201': chairs
'202': charms
'203': charts
'204': chess sets
'205': chessmen
'206': chisels
'207': chopsticks
'208': cigarette cases
'209': cigarette holders
'210': cippi
'211': claypipe
'212': cloth
'213': clothing
'214': coats
'215': coffins
'216': coins
'217': collar
'218': compact discs
'219': containers
'220': coverings
'221': covers
'222': cuffs
'223': cups
'224': deels
'225': deity figurine
'226': diagrams
'227': dice
'228': dishes
'229': documents
'230': dolls
'231': doors
'232': drawings
'233': dresses
'234': drums
'235': dung-chen
'236': earrings
'237': embroidery
'238': ensembles
'239': envelopes
'240': 'equipment for personal use: grooming, hygiene and health care'
'241': ewers
'242': fans
'243': female figurine
'244': fiddles
'245': figures
'246': figurines
'247': finials
'248': flagons
'249': flags
'250': flasks
'251': fragments
'252': furniture components
'253': gameboards
'254': gaming counters
'255': ge
'256': glassware
'257': gongs
'258': gowns
'259': greeting cards
'260': hair ornaments
'261': hairpins
'262': handles
'263': handscrolls
'264': harnesses
'265': hats
'266': headdresses
'267': headrests
'268': heads
'269': headscarves
'270': hobs
'271': houses
'272': illuminated manuscripts
'273': incense burners
'274': incense sticks
'275': ink bottles
'276': inkstands
'277': inkstones
'278': inkwells
'279': inlays
'280': jackets
'281': jar seal
'282': jars
'283': jewelry
'284': juglets
'285': jugs
'286': keys
'287': kimonos
'288': knives
'289': ladles
'290': lamps
'291': lanterns
'292': lanyards
'293': lids
'294': maces
'295': manuscripts
'296': maps
'297': masks
'298': medals
'299': miniatures
'300': mirrors
'301': models
'302': money
'303': mounts
'304': mugs
'305': mummies
'306': musical instruments
'307': nails
'308': necklaces
'309': needles
'310': netsukes
'311': nozzles
'312': obelisks
'313': oil lamps
'314': ornaments
'315': pages
'316': paintings
'317': paper money
'318': paperweights
'319': papyrus
'320': pectorals
'321': pendants
'322': pestles
'323': petticoats
'324': photograph albums
'325': photographs
'326': pictures
'327': pins
'328': pipes
'329': playing card boxes
'330': playing cards
'331': plumb bobs
'332': plume holders
'333': poker
'334': postage stamps
'335': postcards
'336': posters
'337': pots
'338': pottery
'339': prayers
'340': printing blocks
'341': printing plates
'342': prints
'343': punch bowls
'344': puppets
'345': purses
'346': puzzles
'347': quilts
'348': razors
'349': reliefs
'350': rifles
'351': rings
'352': robes
'353': roofing tile
'354': rose bowls
'355': rubbings
'356': rugs
'357': rulers
'358': sandals
'359': saris
'360': sarongs
'361': sashes
'362': saucers
'363': scabbards
'364': scaraboids
'365': scarabs
'366': scepters
'367': scissors
'368': scrolls
'369': sculpture
'370': seed
'371': seppa
'372': shadow puppets
'373': shawls
'374': shears
'375': shell
'376': sherds
'377': shields
'378': shoes
'379': shrines
'380': sistra
'381': situlae
'382': sketches
'383': skewers
'384': skirts
'385': snuff bottles
'386': socks
'387': spatulas
'388': spearheads
'389': spears
'390': spittoons
'391': spoons
'392': statues
'393': statuettes
'394': steelyards
'395': stelae
'396': sticks
'397': stirrup jars
'398': stools
'399': stoppers
'400': straps
'401': studs
'402': swords
'403': tablets
'404': tacks
'405': talismans
'406': tallies
'407': tangrams
'408': tankards
'409': tea bowls
'410': tea caddies
'411': tea kettles
'412': teacups
'413': teapots
'414': telephones
'415': ties
'416': tiles
'417': toggles
'418': toilet caskets
'419': tools
'420': toys
'421': trays
'422': trophies
'423': trousers
'424': tubes
'425': tureens
'426': tweezers
'427': typewriters
'428': underwear
'429': unidentified
'430': urinals
'431': ushabti
'432': utensils
'433': vases
'434': vessels
'435': waistcoats
'436': watches
'437': weight
'438': weights
'439': whistles
'440': whorls
'441': wood blocks
'442': writing boards
- name: other_name
dtype: string
- name: material
dtype: string
- name: production.period
dtype: string
- name: production.place
dtype: string
- name: new_root
dtype: string
splits:
- name: train
num_bytes: 588570034.52
num_examples: 22904
- name: validation
num_bytes: 158671500.7
num_examples: 5390
- name: test
num_bytes: 184646508.18
num_examples: 5390
download_size: 930981155
dataset_size: 931888043.4000001
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
提供机构:
james-burton
原始信息汇总
数据集概述
数据集特征
该数据集包含以下特征:
- obj_num: 字符串类型
- file: 字符串类型
- image: 图像类型
- root: 字符串类型
- description: 字符串类型
- label: 类别标签,包含多个类别名称,如 Aegis, Ajaeng Holder, Album Painting 等。
- other_name: 字符串类型
- material: 字符串类型
- production.period: 字符串类型
- production.place: 字符串类型
- new_root: 字符串类型
数据集分割
数据集分为三个部分:
- train: 包含 22904 个样本,总大小为 588570034.52 字节。
- validation: 包含 5390 个样本,总大小为 158671500.7 字节。
- test: 包含 5390 个样本,总大小为 184646508.18 字节。
数据集大小
- 下载大小: 930981155 字节
- 数据集总大小: 931888043.4000001 字节
配置
- config_name: default
- 数据文件路径:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- 数据文件路径:
搜集汇总
数据集介绍

构建方式
在博物馆学与文化遗产数字化领域,OrientalMuseum_min6-white-name数据集通过系统化采集与标注流程构建而成。该数据集整合了东方博物馆藏品的多模态信息,涵盖文物编号、图像、描述文本及详细元数据。构建过程中,每件藏品均依据标准化分类体系进行人工标注,确保类别标签的准确性与一致性。数据划分遵循机器学习常规实践,按比例分割为训练集、验证集与测试集,为模型训练与评估提供结构化支持。
特点
该数据集的核心特点在于其精细的文物分类体系与丰富的元数据维度。涵盖超过440种文物类别,从日常用具如茶具、服饰到礼器、文书等特殊藏品,类别层次分明且覆盖广泛。每一条数据均包含图像、材质、制作年代、产地及多语言名称等结构化字段,形成高信息密度的多模态记录。数据规模庞大,包含数万条样本,且经过均衡划分,为跨模态学习与细粒度分类任务提供了扎实的基础。
使用方法
在文化遗产分析与计算机视觉研究中,该数据集适用于多类任务。研究者可基于图像与文本描述进行跨模态检索,或利用标签体系训练细粒度文物分类模型。数据集的标准化分割支持端到端的模型训练与验证,其丰富的元数据字段可用于年代、产地等属性预测研究。使用时可加载HuggingFace数据集中指定的训练、验证与测试划分,结合图像与文本特征提取方法,探索文物识别、风格分析或历史脉络挖掘等应用场景。
背景与挑战
背景概述
在文化遗产数字化与人工智能交叉领域,东方博物馆数据集由James Burton等人构建,旨在推动文物图像自动分类与识别研究。该数据集聚焦于东方艺术与考古文物,涵盖从古代器具到装饰艺术等四百余种精细类别,其核心研究问题在于解决文物图像因材质、形态及历史背景多样性所导致的分类复杂性。通过提供大规模标注图像,该数据集为计算机视觉技术在文化遗产保护、数字博物馆及跨文化研究中的应用奠定了重要基础,促进了智能化文物管理系统的开发。
当前挑战
该数据集致力于解决文物图像细粒度分类的挑战,其类别涵盖广泛且存在视觉相似性高的子类,如不同材质的器皿或装饰品,这对模型的判别能力提出了极高要求。构建过程中,挑战主要源于文物标注的专业性需求,需依赖领域专家进行精确分类与描述,同时数据收集涉及文物图像的质量不均、背景干扰以及历史文物图像稀缺性问题,这些因素共同增加了数据集构建的复杂度与可靠性保障难度。
常用场景
经典使用场景
在文化遗产数字化与计算机视觉交叉领域,OrientalMuseum_min6-white-name数据集为文物图像分类任务提供了关键支撑。该数据集汇集了东方博物馆藏品的丰富图像,涵盖从古代器物到近代艺术品的四百余种精细类别,为研究者构建了一个多类别、高复杂度的视觉识别基准。其经典应用场景在于训练深度神经网络模型,实现对文物图像的自动化分类与标注,从而推动博物馆藏品管理的智能化进程。
实际应用
在实际应用层面,该数据集支撑了智慧博物馆系统的开发与优化。基于其训练的模型可集成于博物馆导览系统,实现文物实时识别与信息推送,提升观众体验。同时,在藏品数字化归档工作中,自动化分类技术能显著提高编目效率,辅助策展人员进行跨藏品关联分析。此外,该数据集也为在线教育平台提供了丰富的视觉素材,助力文化遗产的公众传播与教育普及。
衍生相关工作
围绕该数据集,学术界衍生出多项经典研究工作。例如,基于其多类别特性开发的层次化分类网络,有效解决了文物细粒度识别难题;结合元数据(如材质、年代)的多模态学习框架,提升了分类模型的解释性与准确性。此外,该数据集常被用作迁移学习的预训练源,支持小样本环境下特定文物类型的识别研究,推动了领域自适应方法在文化遗产计算中的创新应用。
以上内容由遇见数据集搜集并总结生成



