CCDC 2063957: Experimental Crystal Structure Determination|化学数据集|晶体结构数据集
收藏Spatial_Navigation
这是一个专注于四个代表性任务的多模态增强数据集,这些任务需要不同程度的视觉参与和跨模态交互,包括拼图组装、空间导航、视觉搜索和图表重聚焦。
huggingface 收录
Photovoltaic power plant data
包括经纬度、电源板模型、NWP等信息。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国逐日格点降水数据集V2(1960–2024,0.1°)
CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。
国家青藏高原科学数据中心 收录
Kaggle Titanic
该数据集包含了泰坦尼克号乘客的信息,包括乘客的年龄、性别、船舱等级、是否幸存等。主要用于机器学习中的分类任务,预测乘客是否幸存。
www.kaggle.com 收录
