Flickr8k-CN & Flickr30k-CN
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Flickr8k-CN_and_Flickr30k-CN
下载链接
链接失效反馈官方服务:
资源简介:
在我们的图像字幕实验中使用的两个数据集。除Flickr8k-cn外,我们还构建了Flickr30k-cn,这是Flickr30k的双语版本,通过其train/val集的英译汉机器翻译和测试集的人工翻译获得。
Two datasets utilized in our image captioning experiments. In addition to Flickr8k-cn, we constructed Flickr30k-cn, a bilingual version of Flickr30k, which was obtained through English-to-Chinese machine translation for its train/validation sets and human translation for its test set.
提供机构:
OpenDataLab
创建时间:
2023-03-22
搜集汇总
数据集介绍

背景与挑战
背景概述
Flickr8k-CN和Flickr30k-CN是两个用于图像字幕实验的中文图像-文本数据集,其中Flickr30k-CN通过机器翻译和人工翻译实现了双语支持。这些数据集由浙江大学和中国人民大学于2017年发布,旨在促进图像文本预训练研究。
以上内容由遇见数据集搜集并总结生成



