kmewhort/tu-berlin-png
收藏Hugging Face2022-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/kmewhort/tu-berlin-png
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': airplane
'1': alarm clock
'2': angel
'3': ant
'4': apple
'5': arm
'6': armchair
'7': ashtray
'8': axe
'9': backpack
'10': banana
'11': barn
'12': baseball bat
'13': basket
'14': bathtub
'15': bear (animal)
'16': bed
'17': bee
'18': beer-mug
'19': bell
'20': bench
'21': bicycle
'22': binoculars
'23': blimp
'24': book
'25': bookshelf
'26': boomerang
'27': bottle opener
'28': bowl
'29': brain
'30': bread
'31': bridge
'32': bulldozer
'33': bus
'34': bush
'35': butterfly
'36': cabinet
'37': cactus
'38': cake
'39': calculator
'40': camel
'41': camera
'42': candle
'43': cannon
'44': canoe
'45': car (sedan)
'46': carrot
'47': castle
'48': cat
'49': cell phone
'50': chair
'51': chandelier
'52': church
'53': cigarette
'54': cloud
'55': comb
'56': computer monitor
'57': computer-mouse
'58': couch
'59': cow
'60': crab
'61': crane (machine)
'62': crocodile
'63': crown
'64': cup
'65': diamond
'66': dog
'67': dolphin
'68': donut
'69': door
'70': door handle
'71': dragon
'72': duck
'73': ear
'74': elephant
'75': envelope
'76': eye
'77': eyeglasses
'78': face
'79': fan
'80': feather
'81': fire hydrant
'82': fish
'83': flashlight
'84': floor lamp
'85': flower with stem
'86': flying bird
'87': flying saucer
'88': foot
'89': fork
'90': frog
'91': frying-pan
'92': giraffe
'93': grapes
'94': grenade
'95': guitar
'96': hamburger
'97': hammer
'98': hand
'99': harp
'100': hat
'101': head
'102': head-phones
'103': hedgehog
'104': helicopter
'105': helmet
'106': horse
'107': hot air balloon
'108': hot-dog
'109': hourglass
'110': house
'111': human-skeleton
'112': ice-cream-cone
'113': ipod
'114': kangaroo
'115': key
'116': keyboard
'117': knife
'118': ladder
'119': laptop
'120': leaf
'121': lightbulb
'122': lighter
'123': lion
'124': lobster
'125': loudspeaker
'126': mailbox
'127': megaphone
'128': mermaid
'129': microphone
'130': microscope
'131': monkey
'132': moon
'133': mosquito
'134': motorbike
'135': mouse (animal)
'136': mouth
'137': mug
'138': mushroom
'139': nose
'140': octopus
'141': owl
'142': palm tree
'143': panda
'144': paper clip
'145': parachute
'146': parking meter
'147': parrot
'148': pear
'149': pen
'150': penguin
'151': person sitting
'152': person walking
'153': piano
'154': pickup truck
'155': pig
'156': pigeon
'157': pineapple
'158': pipe (for smoking)
'159': pizza
'160': potted plant
'161': power outlet
'162': present
'163': pretzel
'164': pumpkin
'165': purse
'166': rabbit
'167': race car
'168': radio
'169': rainbow
'170': revolver
'171': rifle
'172': rollerblades
'173': rooster
'174': sailboat
'175': santa claus
'176': satellite
'177': satellite dish
'178': saxophone
'179': scissors
'180': scorpion
'181': screwdriver
'182': sea turtle
'183': seagull
'184': shark
'185': sheep
'186': ship
'187': shoe
'188': shovel
'189': skateboard
'190': skull
'191': skyscraper
'192': snail
'193': snake
'194': snowboard
'195': snowman
'196': socks
'197': space shuttle
'198': speed-boat
'199': spider
'200': sponge bob
'201': spoon
'202': squirrel
'203': standing bird
'204': stapler
'205': strawberry
'206': streetlight
'207': submarine
'208': suitcase
'209': sun
'210': suv
'211': swan
'212': sword
'213': syringe
'214': t-shirt
'215': table
'216': tablelamp
'217': teacup
'218': teapot
'219': teddy-bear
'220': telephone
'221': tennis-racket
'222': tent
'223': tiger
'224': tire
'225': toilet
'226': tomato
'227': tooth
'228': toothbrush
'229': tractor
'230': traffic light
'231': train
'232': tree
'233': trombone
'234': trousers
'235': truck
'236': trumpet
'237': tv
'238': umbrella
'239': van
'240': vase
'241': violin
'242': walkie talkie
'243': wheel
'244': wheelbarrow
'245': windmill
'246': wine-bottle
'247': wineglass
'248': wrist-watch
'249': zebra
splits:
- name: train
num_bytes: 590878465.7704024
num_examples: 19879
- name: test
num_bytes: 6007805.400597609
num_examples: 201
download_size: 590867064
dataset_size: 596886271.171
---
# TU-Berlin Sketch Dataset
This is the full PNG dataset from [TU-Berlin](https://cybertron.cg.tu-berlin.de/eitz/projects/classifysketch/).
许可证:CC BY 4.0
数据集信息:
特征字段:
- 名称:图像(image),数据类型:图像
- 名称:标签(label),数据类型:
类别标签(class_label):
类别映射:
'0': 飞机(airplane)
'1': 闹钟(alarm clock)
'2': 天使(angel)
'3': 蚂蚁(ant)
'4': 苹果(apple)
'5': 手臂(arm)
'6': 扶手椅(armchair)
'7': 烟灰缸(ashtray)
'8': 斧头(axe)
'9': 背包(backpack)
'10': 香蕉(banana)
'11': 谷仓(barn)
'12': 棒球棒(baseball bat)
'13': 篮子(basket)
'14': 浴缸(bathtub)
'15': 熊(动物)(bear (animal))
'16': 床(bed)
'17': 蜜蜂(bee)
'18': 啤酒杯(beer-mug)
'19': 铃铛(bell)
'20': 长凳(bench)
'21': 自行车(bicycle)
'22': 双筒望远镜(binoculars)
'23': 软式飞艇(blimp)
'24': 书籍(book)
'25': 书架(bookshelf)
'26': 回飞镖(boomerang)
'27': 开瓶器(bottle opener)
'28': 碗(bowl)
'29': 大脑(brain)
'30': 面包(bread)
'31': 桥梁(bridge)
'32': 推土机(bulldozer)
'33': 公共汽车(bus)
'34': 灌木丛(bush)
'35': 蝴蝶(butterfly)
'36': 橱柜(cabinet)
'37': 仙人掌(cactus)
'38': 蛋糕(cake)
'39': 计算器(calculator)
'40': 骆驼(camel)
'41': 相机(camera)
'42': 蜡烛(candle)
'43': 加农炮(cannon)
'44': 独木舟(canoe)
'45': 轿车(sedan)(car (sedan))
'46': 胡萝卜(carrot)
'47': 城堡(castle)
'48': 猫(cat)
'49': 手机(cell phone)
'50': 椅子(chair)
'51': 枝形吊灯(chandelier)
'52': 教堂(church)
'53': 香烟(cigarette)
'54': 云(cloud)
'55': 梳子(comb)
'56': 电脑显示器(computer monitor)
'57': 电脑鼠标(computer-mouse)
'58': 长沙发(couch)
'59': 奶牛(cow)
'60': 螃蟹(crab)
'61': 起重机(machine)(crane (machine))
'62': 鳄鱼(crocodile)
'63': 皇冠(crown)
'64': 杯子(cup)
'65': 钻石(diamond)
'66': 狗(dog)
'67': 海豚(dolphin)
'68': 甜甜圈(donut)
'69': 门(door)
'70': 门把手(door handle)
'71': 龙(dragon)
'72': 鸭子(duck)
'73': 耳朵(ear)
'74': 大象(elephant)
'75': 信封(envelope)
'76': 眼睛(eye)
'77': 眼镜(eyeglasses)
'78': 脸部(face)
'79': 风扇(fan)
'80': 羽毛(feather)
'81': 消防栓(fire hydrant)
'82': 鱼(fish)
'83': 手电筒(flashlight)
'84': 落地灯(floor lamp)
'85': 带茎花朵(flower with stem)
'86': 飞鸟(flying bird)
'87': 飞碟(flying saucer)
'88': 脚(foot)
'89': 叉子(fork)
'90': 青蛙(frog)
'91': 煎锅(frying-pan)
'92': 长颈鹿(giraffe)
'93': 葡萄(grapes)
'94': 手榴弹(grenade)
'95': 吉他(guitar)
'96': 汉堡包(hamburger)
'97': 锤子(hammer)
'98': 手(hand)
'99': 竖琴(harp)
'100': 帽子(hat)
'101': 头部(head)
'102': 头戴式耳机(head-phones)
'103': 刺猬(hedgehog)
'104': 直升机(helicopter)
'105': 头盔(helmet)
'106': 马(horse)
'107': 热气球(hot air balloon)
'108': 热狗(hot-dog)
'109': 沙漏(hourglass)
'110': 房屋(house)
'111': 人体骨骼(human-skeleton)
'112': 冰淇淋甜筒(ice-cream-cone)
'113': iPod(ipod)
'114': 袋鼠(kangaroo)
'115': 钥匙(key)
'116': 键盘(keyboard)
'117': 刀(knife)
'118': 梯子(ladder)
'119': 笔记本电脑(laptop)
'120': 树叶(leaf)
'121': 灯泡(lightbulb)
'122': 打火机(lighter)
'123': 狮子(lion)
'124': 龙虾(lobster)
'125': 扬声器(loudspeaker)
'126': 邮箱(mailbox)
'127': 扩音器(megaphone)
'128': 美人鱼(mermaid)
'129': 麦克风(microphone)
'130': 显微镜(microscope)
'131': 猴子(monkey)
'132': 月亮(moon)
'133': 蚊子(mosquito)
'134': 摩托车(motorbike)
'135': 老鼠(动物)(mouse (animal))
'136': 嘴巴(mouth)
'137': 马克杯(mug)
'138': 蘑菇(mushroom)
'139': 鼻子(nose)
'140': 章鱼(octopus)
'141': 猫头鹰(owl)
'142': 棕榈树(palm tree)
'143': 熊猫(panda)
'144': 回形针(paper clip)
'145': 降落伞(parachute)
'146': 停车计时器(parking meter)
'147': 鹦鹉(parrot)
'148': 梨(pear)
'149': 钢笔(pen)
'150': 企鹅(penguin)
'151': 坐姿人物(person sitting)
'152': 行走人物(person walking)
'153': 钢琴(piano)
'154': 皮卡(pickup truck)
'155': 猪(pig)
'156': 鸽子(pigeon)
'157': 菠萝(pineapple)
'158': 烟斗(吸烟用)(pipe (for smoking))
'159': 披萨(pizza)
'160': 盆栽植物(potted plant)
'161': 电源插座(power outlet)
'162': 礼物(present)
'163': 椒盐卷饼(pretzel)
'164': 南瓜(pumpkin)
'165': 女式手提包(purse)
'166': 兔子(rabbit)
'167': 赛车(race car)
'168': 收音机(radio)
'169': 彩虹(rainbow)
'170': 左轮手枪(revolver)
'171': 步枪(rifle)
'172': 直排轮滑鞋(rollerblades)
'173': 公鸡(rooster)
'174': 帆船(sailboat)
'175': 圣诞老人(santa claus)
'176': 人造卫星(satellite)
'177': 卫星天线(satellite dish)
'178': 萨克斯管(saxophone)
'179': 剪刀(scissors)
'180': 蝎子(scorpion)
'181': 螺丝刀(screwdriver)
'182': 海龟(sea turtle)
'183': 海鸥(seagull)
'184': 鲨鱼(shark)
'185': 绵羊(sheep)
'186': 轮船(ship)
'187': 鞋子(shoe)
'188': 铲子(shovel)
'189': 滑板(skateboard)
'190': 头骨(skull)
'191': 摩天大楼(skyscraper)
'192': 蜗牛(snail)
'193': 蛇(snake)
'194': 滑雪板(snowboard)
'195': 雪人(snowman)
'196': 袜子(socks)
'197': 航天飞机(space shuttle)
'198': 快艇(speed-boat)
'199': 蜘蛛(spider)
'200': 海绵宝宝(sponge bob)
'201': 勺子(spoon)
'202': 松鼠(squirrel)
'203': 站立的鸟类(standing bird)
'204': 订书机(stapler)
'205': 草莓(strawberry)
'206': 路灯(streetlight)
'207': 潜艇(submarine)
'208': 行李箱(suitcase)
'209': 太阳(sun)
'210': SUV(suv)
'211': 天鹅(swan)
'212': 剑(sword)
'213': 注射器(syringe)
'214': T恤(t-shirt)
'215': 桌子(table)
'216': 台灯(tablelamp)
'217': 茶杯(teacup)
'218': 茶壶(teapot)
'219': 泰迪熊(teddy-bear)
'220': 电话(telephone)
'221': 网球拍(tennis-racket)
'222': 帐篷(tent)
'223': 老虎(tiger)
'224': 轮胎(tire)
'225': 马桶(toilet)
'226': 番茄(tomato)
'227': 牙齿(tooth)
'228': 牙刷(toothbrush)
'229': 拖拉机(tractor)
'230': 交通信号灯(traffic light)
'231': 火车(train)
'232': 树木(tree)
'233': 长号(trombone)
'234': 裤子(trousers)
'235': 卡车(truck)
'236': 小号(trumpet)
'237': 电视(tv)
'238': 雨伞(umbrella)
'239': 厢式货车(van)
'240': 花瓶(vase)
'241': 小提琴(violin)
'242': 对讲机(walkie talkie)
'243': 车轮(wheel)
'244': 手推车(wheelbarrow)
'245': 风车(windmill)
'246': 葡萄酒瓶(wine-bottle)
'247': 葡萄酒杯(wineglass)
'248': 腕表(wrist-watch)
'249': 斑马(zebra)
数据划分:
- 划分名称:train,字节数:590878465.7704024,样本数量:19879
- 划分名称:test,字节数:6007805.400597609,样本数量:201
下载大小:590867064
数据集总大小:596886271.171
# TU-Berlin 素描数据集
本数据集为来自[TU-Berlin](https://cybertron.cg.tu-berlin.de/eitz/projects/classifysketch/)的完整PNG格式数据集。
提供机构:
kmewhort
原始信息汇总
数据集概述
数据集名称
TU-Berlin Sketch Dataset
数据集特征
- image: 图像数据类型
- label: 标签数据类型,包含249个类别,每个类别对应一个具体的物体或概念。
标签类别
- 0: airplane
- 1: alarm clock
- ...
- 249: zebra
数据集划分
- train: 训练集,包含19879个样本,总大小为590878465.7704024字节。
- test: 测试集,包含201个样本,总大小为6007805.400597609字节。
数据集大小
- 下载大小: 590867064字节
- 数据集总大小: 596886271.171字节
许可证
cc-by-4.0
搜集汇总
数据集介绍

构建方式
在计算机视觉与草图识别领域,TU-Berlin草图数据集通过系统化采集流程构建而成。该数据集源自柏林工业大学的研究项目,旨在为草图分类任务提供标准化资源。其构建过程邀请了众多参与者,针对预先定义的250个日常物体类别进行手绘草图创作。每幅草图均以数字形式保存,并经过人工审核与标注,确保图像质量与标签准确性。数据集的划分遵循机器学习常规,将样本分为训练集与测试集,以支持模型训练与评估。
特点
TU-Berlin草图数据集展现出鲜明的学术价值与应用潜力。数据集涵盖250个精细定义的物体类别,从常见物品如“飞机”、“自行车”到抽象概念如“天使”、“彩虹”,类别多样性显著。图像均为黑白手绘草图,突出了形状与轮廓特征,避免了颜色与纹理的干扰。数据规模庞大,包含约两万幅训练样本与少量测试样本,为模型提供了充足的学习材料。这种专注于草图本质的特性,使其成为研究视觉抽象与认知表征的理想平台。
使用方法
该数据集在草图识别与生成研究中具有广泛用途。研究人员可通过HuggingFace平台直接加载数据集,利用其图像与标签对进行监督学习。典型应用包括训练卷积神经网络进行多类别草图分类,或探索生成模型以合成新的草图样本。数据集的标准化格式便于集成到主流深度学习框架中,如PyTorch或TensorFlow。在使用时,建议遵循其预设的训练-测试划分,以保障实验结果的可比性与可复现性,推动草图理解技术的持续发展。
背景与挑战
背景概述
在计算机视觉与图形识别领域,手绘草图的理解与分类一直是极具挑战性的研究方向。TU-Berlin草图数据集由柏林工业大学的研究团队于2012年创建,旨在推动草图识别算法的发展。该数据集核心研究问题在于如何让机器像人类一样理解并分类手绘草图的语义内容,涵盖了从日常物品到抽象概念的250个类别。数据集的建立为草图检索、生成及跨模态学习等任务提供了重要基准,显著促进了草图分析领域的实证研究进展。
当前挑战
TU-Berlin数据集所解决的领域问题在于草图识别,其挑战主要源于手绘草图的抽象性、风格多样性及语义歧义性,要求模型具备强大的特征提取与泛化能力。在构建过程中,研究人员面临数据收集的复杂性,需确保草图样本在类别间的平衡性与代表性,同时处理不同绘画技能参与者带来的风格差异,这些因素共同增加了数据标注与质量控制的难度。
常用场景
经典使用场景
在计算机视觉与模式识别领域,手绘草图识别作为一项基础且富有挑战性的任务,TU-Berlin Sketch数据集凭借其广泛的类别覆盖与丰富的样本数量,成为评估草图分类模型性能的经典基准。该数据集通常被用于训练和测试深度学习模型,特别是卷积神经网络(CNN)和生成对抗网络(GAN),以探索草图特征的有效提取与表示方法。通过该数据集,研究者能够系统分析模型在跨类别草图识别中的泛化能力与鲁棒性,为草图理解研究提供坚实的数据支撑。
衍生相关工作
围绕TU-Berlin Sketch数据集,学术界衍生了一系列经典研究工作。早期研究如Eitz等人提出的草图分类基准,首次系统评估了多种特征描述符在该数据集上的性能。随后,深度学习方法如Sketch-a-Net引入了深度卷积网络,显著提升了草图识别准确率。近年来,生成模型如SketchGAN探索了草图生成与编辑任务,而跨模态研究如零样本草图检索则利用该数据集验证了草图与自然图像之间的语义关联。这些工作共同推动了草图理解领域的算法创新与理论深化。
数据集最近研究
最新研究方向
在计算机视觉与草图识别领域,TU-Berlin草图数据集作为经典的手绘图像资源,持续推动着生成式模型与跨模态理解的前沿探索。当前研究聚焦于利用该数据集的多样化类别,训练能够从文本描述生成连贯草图的扩散模型,这直接关联到人机交互与创意设计的热点应用。同时,学者们致力于提升模型对抽象手绘特征的细粒度识别能力,以增强草图到真实图像的跨模态检索精度,此类进展对教育辅助工具和智能设计系统的开发具有深远意义。
以上内容由遇见数据集搜集并总结生成



