CTC
收藏arXiv2025-09-30 收录
下载链接:
https://europe.naverlabs.com/research/computer-vision/stacmr-scene-text-aware-cross-modal-retrieval/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包括作为测试集的A1和A2类视频序列,这些序列由多种类别的原始(未压缩)超高清(UHD)视频序列组成,格式为YUV 4:2:0。此外,CTC数据集被用于将DLEC架构与HEVC进行基准测试,该数据集包含多种原始UHD视频序列。这些视频的分辨率为超高清(UHD),任务是对视频压缩性能进行测试。
This dataset comprises video sequences of classes A1 and A2 serving as the test set, which are multi-category raw (uncompressed) ultra-high definition (UHD) video sequences formatted as YUV 4:2:0. Additionally, the CTC dataset, which contains a range of raw UHD video sequences, is employed to benchmark the DLEC architecture against HEVC. All the videos involved here have UHD resolution, and the core task is to evaluate video compression performance.
提供机构:
VVC Standardization Activities
搜集汇总
数据集介绍

背景与挑战
背景概述
CTC(COCO-Text Captioned dataset)是一个基于MS COCO数据集的子集,专门用于跨模态检索任务,特点是同时包含场景文本和标题注释,以探索图像中文本信息对检索的影响。该数据集提供了两个测试集划分:CTC-1k(场景文本直接出现在图像标题中)和CTC-5k(场景文本不一定出现在标题中),旨在评估场景文本感知的检索方法。
以上内容由遇见数据集搜集并总结生成



