five

大规模中文视觉语言预训练数据集

收藏
湖北省数据知识产权登记平台2024-09-24 更新2025-01-03 收录
下载链接:
https://zscqj.hubei.gov.cn/hbRegister/register/detail/40289f85916ed0fe0191a277f4b2004b
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从互联网上采集的,通过关键词搜索获取到相应的图片或中文。该数据集包含1.66亿张图像和2.19亿条中文描述。
提供机构:
武汉人工智能研究院
创建时间:
2024-08-30
搜集汇总
数据集介绍
main_image_url
特点
大规模中文视觉语言预训练数据集包含1.66亿张图像和2.19亿条中文描述,适用于多种视觉与语言模型预训练任务,如图像描述生成、图像问答等。数据集通过严格的过滤和增强步骤确保高质量。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务