Streptosporangium sandarakinum Kämpfer et al. 2013|微生物学数据集|分子生物学数据集
收藏GenshinVoice
GenshinVoice是一个包含原神游戏中所有语音文件及其对应文字文本的数据集。数据集直接从游戏中提取,包含多种语言版本,用于学习和研究目的。
github 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
全球海洋观测系统(GOOS)海流数据集
该数据集包含了全球海洋观测系统(GOOS)收集的海流数据,涵盖了全球各大洋的海流速度和方向信息。数据集旨在为海洋科学研究、气候模型和海洋资源管理提供基础数据支持。
www.goosocean.org 收录
MRMR
MRMR是一个专家级的多学科多模态检索基准,包含1502个经过人类专家仔细验证的查询,涵盖了23个领域。与之前的基准相比,MRMR在三个关键方面取得了进步:首先,它挑战了跨多个专业领域的检索系统,能够在不同领域之间进行细粒度的模型比较;其次,查询是推理密集型的,需要更深入地解释图像,例如诊断显微镜幻灯片;此外,还引入了矛盾检索这一新型任务,要求模型识别冲突的概念。与仅限于单个图像或单模态文档的早期基准不同,MRMR提供了一个具有多图像查询和混合模态语料库文档的现实场景。
arXiv 收录
ShapeNet
ShapeNet 是由斯坦福大学、普林斯顿大学和美国芝加哥丰田技术研究所的研究人员开发的大型 3D CAD 模型存储库。该存储库包含超过 3 亿个模型,其中 220,000 个模型被分类为使用 WordNet 上位词-下位词关系排列的 3,135 个类。 ShapeNet Parts 子集包含 31,693 个网格,分为 16 个常见对象类(即桌子、椅子、平面等)。每个形状基本事实包含 2-5 个部分(总共 50 个部分类)。
OpenDataLab 收录
