five

HealthMonitor|医疗监控数据集|异常检测数据集

收藏
huggingface2024-08-26 更新2024-12-12 收录
医疗监控
异常检测
下载链接:
https://huggingface.co/datasets/infinite-dataset-hub/HealthMonitor
下载链接
链接失效反馈
资源简介:
‘HealthMonitor’数据集包含从医院监控系统实时收集的带有时间戳的病人生命体征数据。该数据集旨在供机器学习实践者用于构建和训练模型,以实时检测病人生命体征中的异常,目的是识别需要立即医疗关注的关键健康事件。每个条目包含心率、血压、呼吸频率和血氧饱和度等测量值,并带有标签指示读数是否在正常范围内(标记为‘Normal’)或表示异常(标记为‘Anomaly’)。
创建时间:
2024-08-26
原始信息汇总

HealthMonitor 数据集概述

数据集描述

HealthMonitor 数据集包含从可穿戴设备收集的实时健康数据,旨在识别潜在的健康异常。每个条目代表来自不同参与者的生命体征的时间戳观测值。标签根据后续观测中是否检测到异常进行分配。

CSV 内容预览

Timestamp,ParticipantID,HeartRate,BloodPressureSystolic,BloodPressureDiastolic,ActivityLevel,Label 2023-01-01 00:00:00,001,78,120,80,Sedentary,Normal 2023-01-01 00:05:00,001,102,135,85,Light,Anomaly 2023-01-01 00:10:00,002,85,125,78,Moderate,Normal 2023-01-01 00:15:00,002,95,130,82,Moderate,Normal 2023-01-01 00:20:00,003,100,145,95,Vigorous,Anomaly

数据来源

该数据集使用 Infinite Dataset Hub 和 microsoft/Phi-3-mini-4k-instruct 模型生成。

  • 数据集生成页面: https://huggingface.co/spaces/infinite-dataset-hub/infinite-dataset-hub?q=&dataset=HealthMonitor&tags=science,+real-time,+anomaly+detection
  • 模型: https://huggingface.co/microsoft/Phi-3-mini-4k-instruct
  • 更多数据集: https://huggingface.co/datasets?other=infinite-dataset-hub
AI搜集汇总
数据集介绍
main_image_url
构建方式
HealthMonitor数据集通过Infinite Dataset Hub平台生成,结合了microsoft/Phi-3-mini-4k-instruct模型的技术支持。该数据集模拟了来自可穿戴设备的实时健康数据,涵盖了心率、血压等关键生理指标,并通过时间戳记录每个参与者的健康状态。数据的生成过程基于预设的查询条件,旨在捕捉健康异常的变化趋势。
特点
HealthMonitor数据集的特点在于其高度结构化的时间序列数据,每个数据点均包含详细的生理指标和活动水平信息。数据集特别标注了健康异常的状态,便于研究者进行异常检测分析。此外,数据的生成方式确保了多样性和广泛性,能够覆盖不同健康状态下的生理变化。
使用方法
使用HealthMonitor数据集时,研究者可通过时间序列分析方法,探索健康指标的变化规律,并构建异常检测模型。数据集中的标签信息为监督学习提供了基础,适用于训练和验证机器学习算法。此外,数据集的结构化格式便于直接导入数据分析工具,如Pandas或TensorFlow,进行进一步的处理和建模。
背景与挑战
背景概述
HealthMonitor数据集是一个专注于实时健康监测的合成数据集,旨在通过可穿戴设备收集的实时健康数据来识别潜在的健康异常。该数据集由Infinite Dataset Hub与微软的Phi-3-mini-4k-instruct模型合作生成,主要应用于健康监测和异常检测领域。数据集中的每条记录均包含时间戳、参与者ID、心率、血压、活动水平等关键健康指标,并标注了后续观察中是否检测到异常。该数据集的生成标志着健康监测领域在数据驱动方法上的进一步探索,为研究人员提供了丰富的实验数据,推动了实时健康监测技术的发展。
当前挑战
HealthMonitor数据集在解决健康监测领域的异常检测问题时面临多重挑战。首先,由于数据来源于合成生成,其真实性和准确性可能受到质疑,这可能导致模型在实际应用中的泛化能力不足。其次,健康数据的多样性和复杂性使得异常检测任务更加困难,尤其是在处理多变量时间序列数据时,如何有效捕捉异常模式成为关键问题。此外,数据集的构建过程中,如何确保数据的多样性和代表性,避免偏差引入,也是一个重要的技术挑战。这些挑战不仅影响了数据集的实用性,也对后续模型的训练和评估提出了更高的要求。
常用场景
经典使用场景
HealthMonitor数据集在实时健康监测领域具有广泛的应用,尤其是在通过可穿戴设备收集的生理数据中检测异常情况。该数据集通过时间戳记录的心率、血压和活动水平等关键指标,为研究人员提供了一个模拟真实场景的平台,用于开发和测试异常检测算法。
解决学术问题
HealthMonitor数据集解决了在实时健康监测中如何有效识别和预测健康异常的问题。通过提供带有标签的生理数据,研究人员能够训练和验证机器学习模型,以识别潜在的健康风险,从而推动个性化医疗和预防医学的发展。
衍生相关工作
基于HealthMonitor数据集,许多经典研究工作得以展开,特别是在异常检测和健康预测领域。例如,研究人员开发了基于深度学习的异常检测模型,能够更准确地识别健康数据中的异常模式。此外,该数据集还推动了可穿戴设备与人工智能技术的结合,为未来的智能健康监测系统奠定了基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

全国 1∶200 000 数字地质图(公开版)空间数据库

As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.

DataCite Commons 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

VEDAI

用于训练YOLO模型的VEDAI数据集,包含图像和标签,用于目标检测和跟踪。

github 收录