沪深股票后复权因子|股票市场数据集|数据调整数据集
收藏yahoo-finance-data
该数据集包含从Yahoo! Finance、Nasdaq和U.S. Department of the Treasury获取的财务数据,旨在用于研究和教育目的。数据集包括公司详细信息、高管信息、财务指标、历史盈利、股票价格、股息事件、股票拆分、汇率和每日国债收益率等。每个数据集都有其来源、简要描述以及列出的列及其数据类型和描述。数据定期更新,并以Parquet格式提供,可通过DuckDB进行查询。
huggingface 收录
密云区2022年常住人口情况
该数据是密云区提供的密云区2022年常住人口情况信息,包括1个文本。
北京市公共数据开放平台 收录
云浮市失信被执行人名单信息
该数据包含了2022年至今云浮市失信被执行人名单信息,指云浮市政务服务数据管理局对该信息的变动情况进行跟踪、采集、预测、分析、公布等活动。
开放广东 收录
无人机智能识别违章建筑算法模型的图像训练数据
无人机智能识别违章建筑算法模型的图像训练数据的应用场景主要集中在提升AI模型对违章建筑的识别能力和准确度。通过对这些数据的训练,AI模型能够更有效地支撑无人机在国土空间治理中的智能化监测任务,基于地理坐标与二级标注体系,AI模型能区分未批先建/超面积建设/非法改建等违建形态,可应用于山地村落违建排查、工业园区超容建设监测等场景,可应用于支撑相关管理部门对违法建设行为的早发现、精定位、快处置闭环管理需求。1、数据来源:原始数据通过自有智能无人机拍摄采集,记录图像ID、采集时间、文件路径、采集设备、地理坐标、拍摄高度、环境参数、边界框组等数据,通过数据清洗,保证数据质量。 2、数据预处理与标注:①对原始数据按7:2:1比例划分训练集/验证集/测试集;②采用多级标注体系:一级标签(违建/合规)、二级标签(未批先建/超面积建设/非法改建等)。③关联要素包含用地性质、产权范围等信息。 3、模型选择和初始化:采用YOLOv5预训练模型,并初始化模型参数,设置合理的超参数:学习率0.002-0.0001动态调整,批量大小16,锚框参数根据拍摄图像特征优化;同时集成注意力机制增强小目标检测能力。 4、模型训练:使用PyTorch框架实施分布式训练,设置训练时长,采用迁移学习策略,冻结底层特征提取层参数,引入Mosaic数据增强提升复杂场景适应能力,设置早停机制(patience=15)防止过拟合。 5、模型评估:① 构建多维评估体系:基础指标(mAP@0.5)、夜间检测率、误报率、漏报率。② 设置渐进式测试:单体建筑→建筑群→混合功能区→历史保护区四阶段测试。 6、模型优化:优化推理引擎,保障推理速度,并建立区域特征库机制。
浙江省数据知识产权登记平台 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录