fesvhtr/Urban1k
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/fesvhtr/Urban1k
下载链接
链接失效反馈官方服务:
资源简介:
Urban1k是一个重建版本的数据集,原数据集为BeichenZhang/Urban1k,现以parquet格式打包,便于直接通过Hugging Face的load_dataset方法加载,包含嵌入的图像。数据集包含城市相关的图像和英文描述,规模在1K到10K之间,主要用于图像到文本和文本到图像的检索任务。数据字段包括id(整数示例ID)、image_name(原始图像文件名)、caption(详细的英文描述)和image(以PIL图像格式存储的图像)。
---
pretty_name: Urban1k
task_categories:
- 图像到文本
- 文本到图像
language:
- 英语
size_categories:
- 1K < 样本数 < 10K
tags:
- 检索
- 城市
- 图像-文本
configs:
- config_name: default
data_files:
- split: 测试集
path: data/test-00000-of-00001.parquet
---
# Urban1k
本数据集为[BeichenZhang/Urban1k](https://huggingface.co/datasets/BeichenZhang/Urban1k)的重构版本,已适配Hugging Face `load_dataset`工具直接加载,且将图像嵌入Parquet文件中。
## 使用方法
python
from datasets import load_dataset
dataset = load_dataset("fesvhtr/Urban1k", split="test")
sample = dataset[0]
image = sample["image"] # PIL图像
caption = sample["caption"]
## 数据字段
- `id`: 整数型样本编号。
- `image_name`: 原始图像文件名。
- `caption`: 详细英文描述文本。
- `image`: 存储于Parquet文件中的图像,可通过`datasets`库解码为PIL图像。
提供机构:
fesvhtr



