汕头市濠江区自然资源局设定依据信息|政务服务数据集|法律法规数据集
收藏GenshinVoice
GenshinVoice是一个包含原神游戏中所有语音文件及其对应文字文本的数据集。数据集直接从游戏中提取,包含多种语言版本,用于学习和研究目的。
github 收录
Global Firepower Index (GFI)
Global Firepower Index (GFI) 是一个评估全球各国军事力量的综合指数。该指数考虑了超过50个因素,包括军事预算、人口、陆地面积、海军力量、空军力量、自然资源、后勤能力、地理位置等。数据集提供了每个国家的详细评分和排名,帮助分析和比较各国的军事实力。
www.globalfirepower.com 收录
MRMR
MRMR是一个专家级的多学科多模态检索基准,包含1502个经过人类专家仔细验证的查询,涵盖了23个领域。与之前的基准相比,MRMR在三个关键方面取得了进步:首先,它挑战了跨多个专业领域的检索系统,能够在不同领域之间进行细粒度的模型比较;其次,查询是推理密集型的,需要更深入地解释图像,例如诊断显微镜幻灯片;此外,还引入了矛盾检索这一新型任务,要求模型识别冲突的概念。与仅限于单个图像或单模态文档的早期基准不同,MRMR提供了一个具有多图像查询和混合模态语料库文档的现实场景。
arXiv 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录
CMU-MOSI
CMU-MOSI数据集包括了从93个YouTube的视频中获取的2199个独白类型的短视频片段。每个片段都是一个独立的多模态示例,其中图像、文本和音频占比是均匀的,情感分数取值为[-3,+3],表示从强负向到强正向情感。
DataCite Commons 收录
