Global Entrepreneurship Monitor (GEM) Special Report|创业活动数据集|全球监测数据集
收藏
- Global Entrepreneurship Monitor (GEM) 首次发表,标志着全球创业研究的新纪元。
- GEM 首次应用,涵盖了10个国家的创业活动数据,为全球创业生态系统提供了基础数据。
- GEM 扩展至27个国家,数据集的覆盖范围显著增加,为全球创业研究提供了更广泛的数据支持。
- GEM 发布首个特别报告,聚焦于女性创业,为性别与创业研究提供了重要数据。
- GEM 涵盖的国家数量达到59个,成为全球最大的创业研究项目之一。
- GEM 发布特别报告,探讨全球创业生态系统的演变,为政策制定者提供了重要参考。
- GEM 特别报告关注新冠疫情对全球创业活动的影响,为危机管理提供了实证数据。
光伏电站发电量预估数据
1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。
浙江省数据知识产权登记平台 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
抖音用户行为数据集
(自用)本数据集搜集并收录了122539条2022年7月24日至31日的一周时间内,1000名抖音用户观看短视频的行为记录数据,每条数据都包含6个词条,包括用户ID、视频ID、视频主题、是否喜欢、是否转发、时间戳等数据。
阿里云天池 收录
Rail-DB
Rail-DB是由深圳技术大学创建的铁路检测数据集,包含7432对图像及其标注,涵盖多种光照、道路结构和视角条件。数据集中的轨道通过多边形进行标注,并根据背景被分为九种场景。Rail-DB旨在推动铁路检测算法的进步和比较,通过提供多样化的真实世界铁路图像,增强算法的鲁棒性。此外,数据集的创建过程包括从真实世界火车视频中获取图像,通过粗略和精细两个阶段进行标注,确保标注的准确性和完整性。Rail-DB的应用领域主要集中在铁路异常检测,特别是铁路区域的识别,以提高铁路安全和维护效率。
arXiv 收录