MMChat中文开放域多模态对话数据集
收藏阿里云天池2026-05-16 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/148979
下载链接
链接失效反馈官方服务:
资源简介:
MMChat是一个大规模多模态多轮对话数据集,其中的每个对话都与一个或多个图片相关联。我们设计了多种策略来确保MMChat中对话的质量,并且为图片和对话的相关性提供了人工标注。
<br />Github: https://github.com/silverriver/MMChat
<br />Paper: https://arxiv.org/abs/2108.07154
MMChat is a large-scale multimodal multi-turn dialogue dataset, where each conversation is associated with one or more images. We have designed multiple strategies to ensure the quality of dialogues in MMChat, and provided manual annotations for the relevance between images and their paired dialogues.
<br />Github: https://github.com/silverriver/MMChat
<br />Paper: https://arxiv.org/abs/2108.07154
提供机构:
阿里云天池
创建时间:
2023-03-24
搜集汇总
数据集介绍

背景与挑战
背景概述
MMChat是一个大规模中文开放域多模态对话数据集,每个对话都与一个或多个图片相关联,基于微博评论构建,旨在结合文本和图像进行多轮对话研究。数据集包含四个版本,其中MMChat-hf版本提供了人工标注的图片与对话相关性标签,以确保数据质量,适用于多模态对话生成和相关性分析任务。
以上内容由遇见数据集搜集并总结生成



