five

CogVLM-SFT-311K

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/THUDM/CogVLM-SFT-311K
下载链接
链接失效反馈
官方服务:
资源简介:
CogVLM-SFT-311K是CogVLM v1.0初始训练中使用的主要对齐语料库,它包含图像描述和对话数据,规模为311,000条。该数据集由minigpt4-3500和LLaVA-Instruct-150K混合而成,并经过了中英文翻译和噪声校正。数据集中包括图像和对应的标签,标签中包含图像的描述或对话内容,并按照单轮和多轮对话进行组织。此数据集遵循知识共享署名-非商业性使用4.0国际许可协议,可用于学术研究,但禁止商业用途。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作