five

AaditD/multilingual_rks

收藏
Hugging Face2024-12-08 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/AaditD/multilingual_rks
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含图像及其相关元数据,如语言、页面URL、图像URL、页面标题、章节标题、层次化章节标题、参考描述、归属描述、替代文本描述、MIME类型、原始高度、原始宽度、是否为主图像、归属语言ID、页面最近是否更改、页面上下文描述、章节上下文描述、标题长度、CLIP相似度和翻译后的替代文本。数据集分为训练集和测试集,分别包含6000和1500个样本,总下载大小为16575211655字节,总数据集大小为18791486898字节。

This dataset contains images and their associated metadata, such as language, page URL, image URL, page title, section title, hierarchical section title, reference description, attribution description, alt text description, MIME type, original height, original width, whether it is the main image, attribution language ID, whether the page has changed recently, page context description, section context description, caption length, CLIP similarity, and translated alt text. The dataset is divided into a training set and a test set, containing 6000 and 1500 samples respectively, with a total download size of 16575211655 bytes and a total dataset size of 18791486898 bytes.
提供机构:
AaditD
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作