five

PictoViLT/CG_L3_img_F

收藏
Hugging Face2025-02-24 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/PictoViLT/CG_L3_img_F
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于训练的文本和图像数据,特征字段涵盖了文本处理所需的输入ID、注意力掩码、令牌类型ID和标签,以及图像处理所需的像素值和遮蔽索引。元数据提供了关于数据集的额外信息,如是否仅包含遮蔽token的图片、数据集的逻辑名称和遮蔽图片的方式。训练集共有617个样本,总大小为1,095,181,943字节。

This dataset includes text and image data for training, with feature fields covering input IDs, attention masks, token type IDs, and labels required for text processing, as well as pixel values and masked indices for image processing. The metadata provides additional information about the dataset, such as whether it includes only masked tokens images, the logical name of the dataset, and the method of masking images. The training set consists of 617 samples with a total size of 1,095,181,943 bytes.
提供机构:
PictoViLT
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作