Ballykelly|民间传说数据集|地方历史数据集
收藏LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
O*NET
O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。
www.onetonline.org 收录
中国陆地实际蒸散发数据集(1982-2024)
本数据集为基于蒸散发互补方法研制的中国陆地蒸散发数据产品v2.0。输入数据包括CMFD v2的向下短波辐射、向下长波辐射、气温、湿度、风速、气压,GLASS反照率、发射率等,以及ERA5-Land地表温度等。本数据集时间跨度为1982年-2024年,空间范围为中国陆地。本数据集可为研究长时间尺度水循环和气候变化提供基础。陆地实际蒸散发 (Ea),单位: mm/month。 时间分辨率为逐月;空间分辨率为0.1°。数据类型:NetCDF;本数据仅为陆地实际蒸散发,不含水面。
国家青藏高原科学数据中心 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
MRMR
MRMR是一个专家级的多学科多模态检索基准,包含1502个经过人类专家仔细验证的查询,涵盖了23个领域。与之前的基准相比,MRMR在三个关键方面取得了进步:首先,它挑战了跨多个专业领域的检索系统,能够在不同领域之间进行细粒度的模型比较;其次,查询是推理密集型的,需要更深入地解释图像,例如诊断显微镜幻灯片;此外,还引入了矛盾检索这一新型任务,要求模型识别冲突的概念。与仅限于单个图像或单模态文档的早期基准不同,MRMR提供了一个具有多图像查询和混合模态语料库文档的现实场景。
arXiv 收录
