AUTOBENCH-V|视觉语言模型数据集|模型评估数据集
收藏
- 1AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?南本德大学、MBZUAI、KAUST · 2024年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
M3PDB
M3PDB是一个大规模、多模态、多标签和多语言的提示数据库,旨在解决语音生成中高质量语音提示缺乏的问题。该数据集包含10个标签的语音和视觉模态的注释,涵盖18种语言,拥有约15k说话者和总计400k小时的语音数据。M3PDB通过引入一个多模态、多代理的标注框架,实现精确且分层的跨模态标注。此外,该数据集还提出了一个轻量级的实时、资源受限的推理设置下的提示选择策略。
arXiv 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录