科技创新及人民生活基本情况(2022年)
收藏MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
CESNET-TimeSeries24
CESNET-TimeSeries24数据集是由捷克技术大学和CESNET合作创建的,用于网络流量异常检测和预测的时间序列数据集。该数据集包含了40周内275,124个活跃IP地址的网络流量数据,涵盖了多种设备和网络异常类型。数据集的创建过程包括数据捕获、时间序列聚合和匿名化处理,确保了数据的真实性和隐私保护。该数据集主要应用于网络流量监控、资源分配和服务编排等领域,旨在解决网络流量预测和异常检测中的实际问题。
arXiv 收录
Vehicle Energy Dataset (VED)
Vehicle Energy Dataset (VED)是由密歇根大学创建的一个大规模数据集,包含从2017年11月至2018年11月期间,在美国密歇根州安娜堡收集的383辆个人汽车的燃油和能量数据。该数据集捕捉了车辆的GPS轨迹以及燃油、能量、速度和辅助电源使用的时间序列数据。数据集中的车辆类型多样,包括264辆汽油车、92辆混合动力车和27辆插电式混合动力/电动车。VED数据集总里程约374,000英里,涵盖了从高速公路到交通密集的市中心区域等各种驾驶条件和季节。数据集创建过程中,研究团队通过安装在车辆上的OBD-II记录器收集数据,并对个人身份信息进行了去标识化处理,以保护参与者隐私。VED数据集的应用领域广泛,包括车辆能源消耗建模、驾驶员行为建模、机器学习和深度学习、交通模拟器的校准、最佳路线选择模型、人类驾驶员行为预测以及自动驾驶汽车的决策制定等。
arXiv 收录
