CogVLM-SFT-311K
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/THUDM/CogVLM-SFT-311K?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
CogVLM-SFT-311K是CogVLM v1.0初始训练中使用的主要对齐语料库,它包含图像描述和对话数据,规模为311,000条。该数据集由minigpt4-3500和LLaVA-Instruct-150K混合而成,并经过了中英文翻译和噪声校正。数据集中包括图像和对应的标签,标签中包含图像的描述或对话内容,并按照单轮和多轮对话进行组织。此数据集遵循知识共享署名-非商业性使用4.0国际许可协议,可用于学术研究,但禁止商业用途。
提供机构:
THUDM
创建时间:
2024-07-19



