CogVLM-SFT-311K
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/THUDM/CogVLM-SFT-311K
下载链接
链接失效反馈官方服务:
资源简介:
CogVLM-SFT-311K是CogVLM v1.0初始训练中使用的主要对齐语料库,它包含图像描述和对话数据,规模为311,000条。该数据集由minigpt4-3500和LLaVA-Instruct-150K混合而成,并经过了中英文翻译和噪声校正。数据集中包括图像和对应的标签,标签中包含图像的描述或对话内容,并按照单轮和多轮对话进行组织。此数据集遵循知识共享署名-非商业性使用4.0国际许可协议,可用于学术研究,但禁止商业用途。
创建时间:
2024-07-19



