TV100流式学习基准数据集
收藏国家基础学科公共科学数据中心2026-05-20 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6a09e608f175603f068efa59&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本研究系统整理并标准化汇交了“TV100流式学习视觉基准测试数据集”。本数据集的核心基础源自本团队于2024年发表在《Frontiers of Computer Science》期刊上的前期学术成果[1]。在前期研究中,团队为探究预训练大模型的“知识盲区”,初步挖掘并采集了100个CLIP模型识别准确率最低的高难度电视图像类别。为响应国家科技重大专项针对流数据处理的规范化评测需求,本研究在原始TV100数据的基础上,进一步开展了深度的实体数据加工与重用封装工作。具体贡献包括:针对流数据场景,对原始数据进行了严格的二次筛选与质量把控;构建了符合主流深度学习框架底层加载规范的物理层级目录(最终汇交41,716张训练集图像与4,000张测试集图像),并在此基础上设计实施了面向流数据的标准化预处理与任务构建流程。本数据论文详实记录了数据的溯源演化、流式预处理机制及物理组织结构。该数据集还原了真实流式环境中新类别突发涌现的客观规律,为流数据测试与评估提供一套新的基准数据。
提供机构:
南京大学



