aharma/flickr30k_dogs_and_babies_128
收藏Hugging Face2023-08-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/aharma/flickr30k_dogs_and_babies_128
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从Flickr30k数据集中选取的包含狗和婴儿的图片,用于马斯特里赫特大学高级自然语言处理课程的图像到文本/文本到图像的教程。为了简化演示并减少数据大小和训练时间,只选择了包含狗或小孩描述的图片,并将图片裁剪为128x128像素的正方形以适应SWIN transformer。
提供机构:
aharma
原始信息汇总
数据集概述
数据集名称
pictures of dogs and babies selected from flickr30k dataset
任务类别
image-to-text
数据集描述
该数据集是为马斯特里赫特大学的高级自然语言处理(KEN4259)课程的图像到文本/文本到图像教程创建的。为了制作一个好的演示,同时限制数据大小和所需的训练时间,我们仅选择了标题中包含狗或小孩术语的图像。图像还被裁剪为正方形并压缩为128 x 128像素,以适应我们的SWIN transformer。
作者和致谢
Aki Härmä, 马斯特里赫特大学高级计算科学系,科学与工程学院,荷兰
许可证
Flickr30k数据可用于研究和教育用途。有关原始许可证和引用信息,请参见Flickr30k数据集。
项目状态
初稿



