Yirany/UniMM-Chat
收藏Hugging Face2024-01-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Yirany/UniMM-Chat
下载链接
链接失效反馈官方服务:
资源简介:
UniMM-Chat数据集是一个开源、知识密集、多轮多模态对话数据集,由GPT-3.5生成。该数据集包含1.1M条多样化的指令,并利用不同视觉语言数据集的互补注释,生成了117,238个对话,每个对话平均有9.89轮。数据集的主要特征包括ds_name、image、conversation、origin_dataset、idx和image_path。
提供机构:
Yirany
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-nc-4.0
- 任务类别:
- 对话
- 文本生成
- 语言: 英语
- 数据集大小: 1M<n<10M
- 数据集名称: UniMM-Chat
数据集详情
- 数据集描述: UniMM-Chat是一个开源、知识密集型、多轮多模态对话数据集,由GPT-3.5驱动,包含1.1M多样化的指令。
- 数据集构成: 利用不同视觉语言数据集的补充注释,通过GPT-3.5生成与每张图片对应的多轮对话,共117,238个对话,平均每对话9.89轮。
数据集特征
- 特征名称: ds_name, image, conversation, origin_dataset, idx, image_path
- 数据类型: string, image, string, string, int64, string



