PeterLOVANAS/image_cap_coco_th
收藏Hugging Face2024-06-11 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/PeterLOVANAS/image_cap_coco_th
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和文本信息,主要用于图像描述任务。数据集中的每个样本包含图像、文件路径、句子ID、文件名、图像ID、数据集分割类型、句子分词、原始句子、句子ID、COCO ID和泰语句子等特征。数据集分为训练集、验证集和测试集,分别包含6797、150和150个样本。数据集的下载大小为1152292354字节,总大小为1160357143字节。
该数据集包含图像和文本信息,主要用于图像描述任务。数据集中的每个样本包含图像、文件路径、句子ID、文件名、图像ID、数据集分割类型、句子分词、原始句子、句子ID、COCO ID和泰语句子等特征。数据集分为训练集、验证集和测试集,分别包含6797、150和150个样本。数据集的下载大小为1152292354字节,总大小为1160357143字节。
提供机构:
PeterLOVANAS
原始信息汇总
数据集概述
数据集特征
- image: 图像数据
- filepath: 文件路径,字符串类型
- sentids: 句子ID列表,整数类型
- filename: 文件名,字符串类型
- imgid: 图像ID,整数类型
- split: 数据集分割,字符串类型
- sentences_tokens: 句子分词列表,字符串类型
- sentences_raw: 原始句子列表,字符串类型
- sentences_sentid: 句子ID列表,整数类型
- cocoid: COCO ID,整数类型
- th_sentences_raw: 泰语原始句子序列,字符串类型
数据集分割
- train: 训练集,包含6797个样本,大小为1106930236.0字节
- validation: 验证集,包含150个样本,大小为27953686.0字节
- test: 测试集,包含150个样本,大小为25473221.0字节
数据集大小
- 下载大小: 1152292354字节
- 总大小: 1160357143.0字节
配置
- default: 默认配置
- train: 数据路径为
data/train-* - validation: 数据路径为
data/validation-* - test: 数据路径为
data/test-*
- train: 数据路径为



