A07_16636.JPG
收藏Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PRBench
PRBench是一个大规模专家标注的专业领域高风险推理基准测试数据集,当前版本覆盖法律和金融领域。包含1,100个专家编写的跨金融和法律领域的对话,19,356个专家策划的评估标准(每个任务10-30条),覆盖114个国家、47个美国司法管辖区和25个专业主题,并包含最具挑战性任务的硬子集(Finance-300, Legal-250)。
github 收录
O*NET
O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。
www.onetonline.org 收录
哈尔滨市区域产业链点发展评估数据
我司基于哈尔滨市区域产业发展的特征,结合数据的可获得性和有效性,基于不同产业链点的产业规模、龙头效应、资本热度、科技创新、发展效率等多个维度构建哈尔滨市区域产业链点的综合发展效能评估体系,并完成数据收集、数据清洗、特征衍生、模型构建、模型验证全过程,形成涵盖哈尔滨市主要产业链下核心链点的区域产业链点发展评分,能有效帮助金融机构在制定产业相关信贷政策以及确定特定产业预授信额度时,更准确全面地评价区域产业的发展效能和动态变化,辅助金融机构更好做好区域产业金融服务。区域产业链点发展指数 = ∑ Si * Xi ,其中Si是指标相应的权重系数,Xi是评价指标,i=1,2,3,……,21,21个指标包括“区域产业链点在营企业数量”“区域产业链点近1年新注册企业数量”等,指标经归一化处理后参与计算。模型结合专家经验和机器学习算法得出,专家主要基于行业实践、政策导向和国际贸易特点,帮助筛选关键指标并初步设定权重范围,然后通过主成分分析和随机森林算法进一步筛选指标并对初始权重进行优化。
浙江省数据知识产权登记平台 收录
中国逐日格点降水数据集V2(1960–2024,0.1°)
CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。
国家青藏高原科学数据中心 收录
