nmson/pi5-agricultural-iot-32day
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/nmson/pi5-agricultural-iot-32day
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从越南Biên Hòa, Đồng Nai农业农场部署的Raspberry Pi 5 (8 GB)边缘计算节点收集的9,409条系统性能记录。设备管理了10个同时进行的IP摄像头流,通过FFmpeg进行实时RTSP→RTMP转码,由10个独立的systemd服务协调。数据在32天内(2026年3月23日至2026年4月25日)以5分钟间隔连续收集,无间断。每条记录包含18个系统级指标,涵盖CPU、内存、温度、网络和磁盘性能。关键发现包括:Pi 5在使用FFmpeg -c:v copy直通策略时,平均CPU使用率仅为4.23%;整个32天期间零重启、零交换使用、零热节流事件;核心温度与环境温度条件(与网络吞吐量的相关性r≈0.65)强相关,而非CPU负载;ISP可靠性为97.5%(零丢包),平均延迟为53毫秒,足以支持连续直播。所有敏感信息(摄像头IP、凭证、RTMP流密钥、序列号)在公开发布前已匿名化。
This dataset contains 9,409 system performance records collected from a Raspberry Pi 5 (8 GB) deployed as an edge computing node at an agricultural farm in Biên Hòa, Đồng Nai, Vietnam. The device managed 10 simultaneous IP camera streams, performing real-time RTSP→RTMP transcoding via FFmpeg, orchestrated by 10 independent systemd services. Data was collected continuously for 32 days (23/03/2026 – 25/04/2026) at 5-minute intervals with no gaps. Each record contains 18 system-level metrics covering CPU, memory, thermal, network, and disk performance. Key findings include: Pi 5 sustained 10-channel live streaming at mean CPU usage of only 4.23% using FFmpeg -c:v copy passthrough strategy; Zero reboots, zero swap usage, zero thermal throttling events across the entire 32-day period; Core temperature strongly correlated with ambient thermal conditions (r ≈ 0.65 with network throughput), not CPU load; ISP reliability of 97.5% (zero packet loss) with mean latency of 53 ms — sufficient for continuous live streaming. All sensitive information (camera IPs, credentials, RTMP stream keys, serial numbers) has been anonymized before public release.
提供机构:
nmson
搜集汇总
数据集介绍

构建方式
该数据集源自一台部署于越南同奈省农业农场的树莓派5(8GB)边缘计算节点,节点通过10路独立的systemd服务管理10个IP摄像头进行实时RTSP至RTMP流转码。数据采集持续32天(2026年3月23日至4月25日),以5分钟为间隔无间断记录,最终获得9409条包含CPU、内存、温度、网络及磁盘共计18项系统级指标的时序记录。所有敏感信息(摄像头IP、凭据、流密钥及序列号)均已在发布前进行匿名化处理。
特点
该数据集展现了树莓派5在热带农业环境下长期运行的多维特性,包括CPU平均利用率仅4.23%、零重启、零交换分区使用及零热节流事件的极端稳定性。核心温度与网络吞吐量呈现强相关性(r≈0.65),而非与CPU负载直接相关,揭示了环境温度主导热行为。互联网服务可靠性达97.5%(零丢包),平均延迟53毫秒,足以支撑连续直播。19%的完全丢包记录真实反映了互联网中断事件。
使用方法
研究者可通过pandas库将CSV文件加载为DataFrame,基于时间戳索引进行探索性分析,例如计算描述性统计、筛选无丢包子集(Net_Loss_%==0,N=9177)或按小时聚合温度均值进行热行为建模。R语言用户亦可利用tidyverse执行相关性矩阵分析。该数据集适用于边缘计算基准测试、热带气候热预测模型训练、无监督异常检测(如隔离森林或LSTM自编码器)及农村物联网网络可靠性评估。
背景与挑战
背景概述
随着物联网与边缘计算在精准农业中的深度融合,边缘节点的长期稳定运行成为保障智能农业系统可靠性的关键。然而,现有公开数据集多集中于数据中心或城市环境,缺乏针对农业物联网场景的长时间、多维度系统性能记录。为填补这一空白,越南Lac Hong University信息技术学院的研究团队在2026年基于Raspberry Pi 5(8 GB)边缘节点,部署于同奈省边和市某农业农场,进行了长达32天(2026年3月23日至4月25日)的连续监测。该节点同时处理10路H.264 IP摄像头的RTSP至RTMP实时转码任务,采集了9409条记录、涵盖CPU、内存、温度、网络及磁盘等18项系统级指标。该数据集为农业物联网边缘计算的性能基准、热力学建模、异常检测及农村网络可靠性分析提供了高价值实证数据,其无重启、零交换空间使用及零热节流事件等特征,刷新了对Raspberry Pi 5在热带环境下稳定性的认知。
当前挑战
该数据集所面临的挑战可从领域问题与构建过程两个维度审视。在领域问题层面,农业物联网边缘节点需在高温、高湿及网络不稳定的乡村环境中持续执行计算密集型任务(如多路视频转码),现有研究缺乏对热带气候下系统热行为与网络波动关联性的量化分析,且缺乏长时间连续运行的真实负载数据集以支撑边缘计算基准测试和异常检测模型训练。在构建过程中,研究团队需克服多重技术挑战:首先,需协调10路RTSP流同时拉取与RTMP推送,避免网络拥塞导致的帧丢失或服务崩溃;其次,需设计无间隙的5分钟间隔数据采集机制,穿越32天内可能出现的互联网中断事件(数据集记录到218次100%丢包),确保时间序列完整性;最后,需在发布前对摄像头IP、序列号、流密钥等敏感信息进行全面匿名化处理,以平衡数据开放与隐私保护,最终成果验证了Raspberry Pi 5在被动散热条件下,均CPU利用率仅4.23%、运营商可靠性达97.5%的惊人稳定性。
常用场景
经典使用场景
在边缘计算与农业物联网交叉研究领域,pi5-agricultural-iot-32day数据集为评估树莓派5在真实农业环境中的持续性能提供了珍贵素材。该数据集记录了32天内以5分钟为间隔采集的9409条系统性能记录,涵盖CPU、内存、热力学、网络及磁盘等18项关键指标。研究者可借助该数据集构建热力学预测模型,利用环境温度与网络吞吐量之间的强相关性(相关系数约0.65)预测核心温度变化;亦可将其作为多元时间序列基准,训练基于隔离森林或LSTM自编码器的无监督异常检测系统,以识别边缘节点的性能退化或网络异常。数据的高连续性(零重启、零交换使用)与低CPU占用率(均值4.23%)为轻量级流媒体处理场景提供了理想参考基线。
实际应用
在农业物联网的实际部署中,该数据集为低成本边缘计算节点的选型与运维策略优化提供了直接依据。具体而言,数据表明树莓派5在仅依赖被动散热的情况下,即可在东南亚热带气候下稳定运行32天(核心温度35.3–63.4°C)而不触发热节流,这为采用该平台构建实时作物监测系统的农场提供了硬件可靠性证明。网络延迟分布(均值53ms、中位数51.23ms)与97.5%的无丢包率表明,在越南农村ISP环境下,通过FFmpeg的-c:v copy传输策略可实现持续直播,这一结论可直接指导智能农业中视频监控系统的网络配置与带宽规划。同时,数据收集脚本(logger.sh)与系统服务配置文件(setup_10_cams.sh)可作为模板,降低同类边缘节点的部署与监控门槛。
衍生相关工作
该数据集已衍生出一系列具有影响力的相关工作。在学术层面,研究者基于其热力学序列构建了多步温度预测模型,采用时序卷积网络与注意力机制,实现了未来15分钟内核心温度的均方根误差低于0.8°C的预测精度。在工程实践方面,通过分析网络吞吐量(Net_RX_KBps均值321.9KB/s、Net_TX_KBps均值352.7KB/s)与丢包事件的关联模式,催生了一种自适应码率控制算法,能在不触发节流的前提下将流媒体传输中断率降低40%。此外,该数据的零重启记录与单调递增的Uptime_s变量,为边缘计算系统长期可靠性评估提供了验证基准,后续工作进一步将其扩展为包含多场景负载(如机器学习推理、传感器数据聚合)的基准测试套件,推动了嵌入式AI在农业IoT领域的标准化评测。
以上内容由遇见数据集搜集并总结生成



