地址涉农识别|金融贷款数据集|地址识别数据集
收藏
中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
BrowseComp-ZH
BrowseComp-ZH 是一个为全面评估大型语言模型(LLM)在中国网络上的浏览能力而设计的基准数据集。该数据集由289个多跳问题组成,涵盖了11个不同的领域,每个问题都经过逆向工程,从一个简短、客观且易于验证的答案(如日期、数字或专有名词)出发。为了确保问题的难度和答案的唯一性,采用了两阶段的质量控制协议。数据集旨在评估LLM在多跳检索、事实推理和在线信息整合方面的能力。数据集、构建指南和基准结果已公开发布。
arXiv 收录
CIFAR-10-C
CIFAR-10-C是一个用于评估机器学习模型鲁棒性的数据集。它是CIFAR-10数据集的变体,包含了对原始CIFAR-10图像应用多种不同类型的图像损坏(如噪声、模糊、对比度变化等)后的图像。该数据集旨在帮助研究人员测试和改进模型在面对图像损坏时的表现。
github.com 收录
中铁十四局大盾构掘进施工大数据
我公司将盾构机掘进施工产生的基础数据开发成中铁十四局大盾构掘进施工大数据。该数据资源集包括:施工进度报表、日报、项目地层信息表、项目地层基本信息表、数字盾构-盾构预警信息、壳智汇-传感器数据、项目坐标、报表-掘进记录、报表统计(全状态下所有数据)、报表统计(全状态下所有数据)、报表统计(掘进状态下所有数据)、项目环报、管片上浮、气泡仓压力表、大直径盾构项目统计、盾构施工历史数据-传感器表、盾构施工历史数据-实时数据、盾构施工历史数据-单环分析结果、结泥饼预警计算存储、临时点位表、点位信息配置表、点位历史数据、环号所在表信息、掘进状态记录表、环数据临时表。
山东数据资产登记平台 收录
ENTERPRIZE战队2025赛季开源数据集
数据集包含一阶段机器人(车辆)识别数据、二阶段装甲板识别数据和三阶段装甲板图案识别数据。一阶段数据共计3022个,标签定义为0 -> 机器人;二阶段数据共计3504个,标签定义为0 -> 死亡状态装甲板, 1 -> 红色灯条装甲板, 2 -> 蓝色灯条装甲板;三阶段数据共计3528个,标签定义为首字母B/R -> 蓝色/红色(训练中会自动混合),第二个字符:0 -> 前哨站,1-5 -> 1-5号装甲板(5号不会参与训练,但是在此仍提供出来),S(6) -> 哨兵。
github 收录