gtx-coco-2014
收藏魔搭社区2024-07-24 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/quantumbolt/gtx-coco-2014
下载链接
链接失效反馈官方服务:
资源简介:
## 数据集描述
coco2014 caption数据集, 但是添加了data_caption.json
### 数据集简介
提供对于数据集的介绍,支持的使用场景(包括支持的语言等)。
### 数据集支持的任务
Image-Caption Retrieval 任务 (i2c, c2i)
## 数据集的格式和结构
### 数据格式
对数据的格式进行描述,包括数据的schema,以及提供必要的数据样本示范。
如果数据集内含多个子数据集的话,每个字数据集都应该提供相对应的数据格式描述。
### 数据集加载方式
通过代码范例等方式,提供数据集通过git/SDK进行加载和使用的详细说明。
### 数据分片
数据集可以被切分成`train/test/validation`的数据分片,以便于训练和测试模型。您可以通过编辑README.md中的configs标签,来配置自定义数据分片。
您可以使用configs标签,对数据集的自定义分片进行描述。其中,config_name为分片的名称,即子数据集的名称;data_files为该子数据集的数据文件分片,包括split和path两个属性,
分别表示数据集的划分和数据文件的路径。
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
coco2014 caption dataset, with data_caption.json added
### Dataset Introduction
Provides an overview of the dataset and its supported usage scenarios (including supported languages, etc.).
### Supported Dataset Tasks
Image-Caption Retrieval task (i2c, c2i)
## Dataset Format and Structure
### Data Format
Describe the data format, including the data schema, and provide necessary data sample demonstrations. If the dataset contains multiple sub-datasets, corresponding data format descriptions should be provided for each sub-dataset respectively.
### Dataset Loading Method
Provide detailed instructions on loading and utilizing the dataset via git/SDK through code examples and other methods.
### Data Splitting
The dataset can be split into `train/test/validation` data splits to facilitate model training and testing. You can configure custom data splits by editing the configs tag in README.md.
You can use the configs tag to describe custom data splits, where config_name is the name of the split, i.e., the name of the sub-dataset; data_files is the data file split of this sub-dataset, including two attributes: split and path, which respectively represent the dataset split and the path of the data file.
#### Download Method
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-03-26



