CHAI_testset
收藏数据集概述
CHAI_testset 是一个用于评估视频字幕生成和批评生成的数据集,基于 CHAI (Critique-based Human–AI) 框架构建,旨在通过人类与人工智能协作实现精确的视频语言描述。
数据集任务类别
- video-text-to-text: 视频到文本的转换任务(视频字幕生成与评价)。
数据集背景
该数据集是为 CHAI 评估系统设计的测试集。CHAI 是一个监督框架,由受过训练的人类专家与模型生成的预字幕配对,专家提供修正性批评,指导模型将预字幕改进为更优的后字幕。数据集基于结构化字幕规范构建,涵盖主体、场景、运动、空间布局和摄像机动态,并借鉴了专业电影制作人的视觉基元。
数据集文件结构
数据集包含以下评估文件:
test_split.json: 原始评估数据。每条记录包含视频路径、模型生成的预字幕、人类撰写的批评、修订后的最终字幕(后字幕)及相关元数据。eval_caption_generation_test.json: 为字幕生成任务格式化。将视频与任务指令及最终后字幕配对。eval_critique_generation_test.json: 为批评生成任务格式化。将视频、任务指令及待批评的字幕配对。eval_caption_yes_or_no_test.json: 为奖励建模(二元对齐评分)任务格式化。
数据集使用示例
可使用 Hugging Face CLI 下载完整数据集(包含视频和评估 JSON 文件):
bash pip install huggingface_hub hf download datasets/chancharikm/CHAI_testset --local-dir ./CHAI_testset
引用
如果您使用了本数据集,请引用以下论文:
@inproceedings{chai2026, title = {Building a Precise Video Language with Human--AI Oversight}, author = {Zhiqiu Lin and Chancharik Mitra and Siyuan Cen and Isaac Li and Yuhan Huang and Yu Tong Tiffany Ling and Hewei Wang and Irene Pi and Shihang Zhu and Ryan Rao and George Liu and Jiaxi Li and Ruojin Li and Yili Han and Yilun Du and Deva Ramanan}, booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, year = {2026} }




