five

fesvhtr/Urban1k

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/fesvhtr/Urban1k
下载链接
链接失效反馈
官方服务:
资源简介:
Urban1k是一个重建版本的数据集,原数据集为BeichenZhang/Urban1k,现以parquet格式打包,便于直接通过Hugging Face的load_dataset方法加载,包含嵌入的图像。数据集包含城市相关的图像和英文描述,规模在1K到10K之间,主要用于图像到文本和文本到图像的检索任务。数据字段包括id(整数示例ID)、image_name(原始图像文件名)、caption(详细的英文描述)和image(以PIL图像格式存储的图像)。

--- pretty_name: Urban1k task_categories: - 图像到文本 - 文本到图像 language: - 英语 size_categories: - 1K < 样本数 < 10K tags: - 检索 - 城市 - 图像-文本 configs: - config_name: default data_files: - split: 测试集 path: data/test-00000-of-00001.parquet --- # Urban1k 本数据集为[BeichenZhang/Urban1k](https://huggingface.co/datasets/BeichenZhang/Urban1k)的重构版本,已适配Hugging Face `load_dataset`工具直接加载,且将图像嵌入Parquet文件中。 ## 使用方法 python from datasets import load_dataset dataset = load_dataset("fesvhtr/Urban1k", split="test") sample = dataset[0] image = sample["image"] # PIL图像 caption = sample["caption"] ## 数据字段 - `id`: 整数型样本编号。 - `image_name`: 原始图像文件名。 - `caption`: 详细英文描述文本。 - `image`: 存储于Parquet文件中的图像,可通过`datasets`库解码为PIL图像。
提供机构:
fesvhtr
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作