J-CRe3
收藏J-CRe3数据集概述
数据集描述
J-CRe3是一个包含真实世界对话的日语对话数据集,涉及一个帮助主人完成日常琐事的机器人。数据集包含93个基于场景的对话,总计2,131个话语和11,024秒的视频。
数据集内容
视频和音频文件
- 视频文件:包括第一人称视频(
fp_video.mp4)和第三人称视频(cam11.mp4,cam12.mp4,cam13.mp4,cam14.mp4)。 - 音频文件:对话音频文件(
audio.wav)。 - 元数据文件:
info.json包含场景ID、说话者ID和话语与视频帧之间的时间对齐信息。 - 时间戳文件:
timestamp.json记录了录音的开始时间。
标注信息
- 边界框:视频帧中物体和区域的边界框,共79,694个。
- 文本引用:对话中的文本到文本引用,包括谓词-论元结构、桥接引用和共指。
- 文本到物体引用:对话文本中的短语与视频帧中物体之间的引用,包括间接引用关系和直接引用关系。
标注文件
- 文本标注:位于
textual_annotations/,使用KNP格式。 - 视觉标注:位于
visual_annotations/,包含边界框和文本到物体的引用。 - 场景ID文件:位于
id/,提供训练/验证/测试分割。 - 转录文件:位于
transcriptions/,包含对话音频的转录。 - 原始标注文件:位于
raw_annotations/,包含边界框和文本到物体的引用。 - 一致性文件:位于
agreement/,用于测量注释者之间的一致性。
数据集统计
详细统计信息请参阅statistics.md。
许可证
本数据集遵循CC BY-SA 4.0许可证。
引用信息
当使用此数据集时,请引用以下论文:
bibtex @inproceedings{ueda-2024-j-cre3, title = {J-CRe3: A Japanese Conversation Dataset for Real-world Reference Resolution}, author = {Nobuhiro Ueda and Hideko Habe and Yoko Matsui and Akishige Yuguchi and Seiya Kawano and Yasutomo Kawanishi and Sadao Kurohashi and Koichiro Yoshino}, booktitle = {Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)}, month = may, year = {2024}, url = {https://aclanthology.org/2024.lrec-main.829}, pages = {9489--9502}, address = {Turin, Italy}, }




