Concatenated alignment of exonic sequence data
收藏SAVEE
SAVEE(Surrey Audio-Visual Expressed Emotion)数据集包含480个音频和视频文件,由4名男性英语母语者在7种不同的情绪状态下录制。这些情绪包括愤怒、高兴、悲伤、惊讶、恐惧、厌恶和中性。每个文件的时长约为3秒,总时长约为24分钟。该数据集主要用于情感识别研究。
kahlan.eps.surrey.ac.uk 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。时间为北京时间。
国家海洋科学数据中心 收录
XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
哈尔滨市区域产业链点发展评估数据
我司基于哈尔滨市区域产业发展的特征,结合数据的可获得性和有效性,基于不同产业链点的产业规模、龙头效应、资本热度、科技创新、发展效率等多个维度构建哈尔滨市区域产业链点的综合发展效能评估体系,并完成数据收集、数据清洗、特征衍生、模型构建、模型验证全过程,形成涵盖哈尔滨市主要产业链下核心链点的区域产业链点发展评分,能有效帮助金融机构在制定产业相关信贷政策以及确定特定产业预授信额度时,更准确全面地评价区域产业的发展效能和动态变化,辅助金融机构更好做好区域产业金融服务。区域产业链点发展指数 = ∑ Si * Xi ,其中Si是指标相应的权重系数,Xi是评价指标,i=1,2,3,……,21,21个指标包括“区域产业链点在营企业数量”“区域产业链点近1年新注册企业数量”等,指标经归一化处理后参与计算。模型结合专家经验和机器学习算法得出,专家主要基于行业实践、政策导向和国际贸易特点,帮助筛选关键指标并初步设定权重范围,然后通过主成分分析和随机森林算法进一步筛选指标并对初始权重进行优化。
浙江省数据知识产权登记平台 收录
中国逐日格点降水数据集V2(1960–2024,0.1°)
CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。
国家青藏高原科学数据中心 收录
