Obscure-Entropy/PIXELPROSE_HU
收藏Hugging Face2024-08-27 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Obscure-Entropy/PIXELPROSE_HU
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个扩展的图像描述数据集,特别为PixelProse增强,并增加了匈牙利语翻译。它为从事图像描述研究的研究人员和开发者提供了宝贵的资源,特别是那些对PixelProse和跨语言应用感兴趣的人。数据集包含约1680万条描述,分为17个parquet文件,便于部分或全部下载和使用。数据字段包括图像的URL、图像本身、英文描述和匈牙利语描述。数据集的一个限制是匈牙利语描述的机器翻译准确性可能存在问题,以及为了减少数据集大小和便于下载处理,JPEG图像的质量有所降低。
This is an extended image captioning dataset, specifically enhanced for the PixelProse project and augmented with Hungarian translations. The dataset contains approximately 16.8 million captions, covering English and Hungarian image descriptions. The dataset structure includes the URL of the image, the image itself, and the corresponding English and Hungarian captions. The dataset is divided into 17 parquet files, facilitating partial download and processing. The dataset is primarily used for image captioning tasks, especially for cross-lingual applications.
提供机构:
Obscure-Entropy



