five

zk-a2a-iot

收藏
Hugging Face2026-04-01 更新2026-04-02 收录
下载链接:
https://huggingface.co/datasets/binodmx/zk-a2a-iot
下载链接
链接失效反馈
官方服务:
资源简介:
zk-a2a-iot 数据集包含代表物联网设备代理在各种智能系统领域中交换消息的合成提示。该数据集专为隐私保护的代理通信研究而设计,旨在在保持消息上下文和实用性的同时,对敏感信息进行编辑。数据集结构包括原始数据集(CSV 文件)和多轮对话数据(jsonl 文件)。原始数据集包含以下字段:原始未编辑的代理消息、提取的敏感值、经过处理的敏感消息、消息所属的物联网领域、零知识证明ID、ZKP验证结果以及基于验证的访问决策。多轮对话数据遵循OpenAI的ChatML格式,分别记录了Agent_0和Agent_1的对话流程。数据集覆盖了多个物联网/智能系统领域,包括智能医疗、智能电网、智能交通、智能农业、智能家居、智能城市、智能基础设施和智能环境。敏感数据被替换为标准化的占位符,如温度、湿度、位置、功率等类别。该数据集可用于评估隐私保护的物联网/边缘通信协议、测试物联网/边缘数据的零知识证明AI系统、研究物联网/边缘领域的代理间通信以及基准测试代理通信的编辑和清理技术。
创建时间:
2026-03-31
原始信息汇总

zk-a2a-iot 数据集概述

数据集基本信息

  • 数据集名称: zk-a2a-iot
  • 许可证: MIT
  • 语言: 英语 (en)
  • 数据规模: n<1K
  • 配置: 提供三种配置:defaultagent0agent1

数据集描述

该数据集包含代表在各种智能系统领域中物联网设备代理之间交换消息的合成提示。数据专为隐私保护代理通信研究而设计,其中需要在保持消息上下文和效用的同时,对敏感信息进行编辑。

数据集结构

原始数据集

原始数据集以CSV文件 (data.csv) 提供,包含以下字段:

  • prompt: 包含敏感数据的原始、未编辑的代理消息
  • inputs: 类型到其提取的敏感值的JSON映射
  • sanitized_prompt: 敏感值被编辑占位符替换后的消息
  • category: 消息的物联网领域
  • proofs: 类型到其零知识证明ID的JSON映射
  • results: 类型到ZKP验证结果的JSON映射
  • actions: 基于证明验证的访问决策 (allow | deny)

Agent_0 多轮对话

Agent_0的多轮对话列表,遵循OpenAI的ChatML格式,以jsonl文件 (agent0_conversations.jsonl) 提供。 对话流程包含:

  • System Message: 描述agent_0的角色和任务
  • User Message: 包含敏感物联网传感器数据的用户请求
  • Assistant Message: 调用工具生成每个敏感值的证明
  • Tool Message: 包含<类型, 证明ID>对的工具响应
  • Assistant Message: 带有证明清单的编辑后用户请求

Agent_1 多轮对话

Agent_1的多轮对话列表,遵循OpenAI的ChatML格式,以jsonl文件 (agent1_conversations.jsonl) 提供。 对话流程包含:

  • System Message: 描述agent_0的角色和任务
  • User Message: 带有证明清单的、经过编辑的物联网传感器数据用户请求
  • Assistant Message: 调用工具验证每个证明
  • Tool Message: 包含<类型, 结果>对的工具响应
  • Assistant Message: 基于证明验证结果接受或拒绝用户请求

覆盖领域

数据集涵盖以下物联网/智能系统领域:

  • 智能医疗保健: 与患者监护、医疗设备和医院系统相关的消息
  • 智能电网: 关于电力分配、发电和电网管理的消息
  • 智能交通: 来自车辆、交通系统和交通基础设施的消息
  • 智能农业: 来自农业设备、传感器和农业监测系统的消息
  • 智能家居: 来自家庭自动化设备和安全系统的消息
  • 智慧城市: 来自城市基础设施(如废物管理和停车传感器)的消息
  • 智能基础设施: 来自关键基础设施监控(水、公用事业)的消息
  • 智能环境: 来自环境监测和气象站的消息

编辑类别

消息中的敏感数据已被标准化的占位符替换。使用的编辑类别如下:

  • [TEMPERATURE]: 温度读数
  • [HUMIDITY]: 湿度百分比
  • [LOCATION]: 地理坐标
  • [POWER]: 功率/能量读数
  • [BATTERY_LEVEL]: 电池电量百分比
  • [FUEL_LEVEL]: 燃料水平
  • [SENSOR_READING]: 通用传感器值
  • [VALUE]: 通用数值
  • [DEVICE_ID]: 设备标识符
  • [SPEED]: 速度测量值
  • [SOIL_MOISTURE]: 土壤湿度百分比
  • [GRID_LOAD]: 电网负载百分比
  • [FLOW]: 流速
  • [PRESSURE]: 压力读数
  • [CURRENT]: 电流
  • [VOLTAGE]: 电压读数
  • [DISTANCE]: 距离测量值
  • [CHARGE_RATE]: 充电速率

用途

该数据集可用于:

  • 评估隐私保护的物联网/边缘通信协议
  • 测试用于物联网/边缘数据的零知识证明AI系统
  • 研究物联网/边缘领域的代理间通信
  • 对代理通信的编辑和清理技术进行基准测试

许可证与引用

该数据集仅供研究目的提供。如果在出版物中使用,请适当引用。

搜集汇总
数据集介绍
main_image_url
构建方式
在物联网智能系统研究领域,zk-a2a-iot数据集通过合成方法构建,模拟了智能设备代理间的通信消息。其原始数据以CSV格式组织,每条记录包含原始提示、敏感信息映射、脱敏后提示及验证结果等字段。同时,数据集还提供了遵循OpenAI ChatML格式的多轮对话记录,分别对应两个代理的交互流程,涵盖了从敏感数据提取、零知识证明生成到验证决策的完整通信链条。
特点
该数据集的核心特点在于其专注于隐私保护的物联网代理通信,覆盖了智能医疗、智能电网、智能交通等八大关键领域。所有敏感数据均被系统性地替换为标准化占位符,例如温度、位置、设备标识等共18类红标类别,确保了数据的实用性与隐私安全之间的平衡。多轮对话结构清晰展现了代理间基于零知识证明的交互逻辑,为研究提供了高度结构化的实验场景。
使用方法
研究人员可利用此数据集评估物联网边缘计算中的隐私保护通信协议,测试基于零知识证明的AI系统在敏感数据处理上的效能。数据集支持对代理间通信的红标与脱敏技术进行基准测试,适用于智能系统领域内代理通信机制的研究与验证。通过加载不同的配置,用户可分别访问原始数据集或特定代理的对话记录,从而灵活适配各类实验设计需求。
背景与挑战
背景概述
物联网(IoT)技术的迅猛发展催生了海量设备间的智能交互需求,zk-a2a-iot数据集应运而生,专注于智能系统中设备代理间的隐私保护通信研究。该数据集由研究团队于近期构建,旨在探索在保持消息上下文与实用性的前提下,如何通过零知识证明等技术对敏感信息进行脱敏处理。其核心研究问题聚焦于物联网边缘计算环境中,代理间通信的隐私安全与数据效用平衡,覆盖智慧医疗、智能电网、智慧交通等多个关键领域,为隐私增强计算与分布式人工智能提供了重要的实验基准。
当前挑战
该数据集致力于解决物联网代理通信中的隐私保护挑战,即在多域异构设备交互中,如何实现敏感数据的可靠脱敏与验证,同时维持通信效率与语义完整性。构建过程中的挑战包括:合成数据需精准模拟真实物联网消息的多样性与复杂性,涵盖温度、位置、设备标识等多类敏感信息;设计标准化的脱敏占位符体系,确保跨域数据的一致性与可解释性;以及构建多轮对话结构,以支持零知识证明生成与验证的端到端流程建模,这对数据标注与逻辑一致性提出了较高要求。
常用场景
经典使用场景
在物联网智能系统领域,数据隐私与通信效率的平衡是核心挑战。zk-a2a-iot数据集通过模拟智能设备代理间的多轮对话,为隐私保护通信研究提供了标准化的实验平台。其经典使用场景集中于训练和评估基于零知识证明的代理通信模型,使模型能够在保持消息上下文完整性的前提下,自动识别并替换敏感信息,如温度、位置或设备标识,从而验证隐私增强技术在分布式物联网环境中的可行性与鲁棒性。
衍生相关工作
围绕该数据集,学术界衍生出一系列聚焦于隐私保护物联网通信的经典研究工作。这些工作主要探索基于深度学习的敏感信息自动识别与脱敏算法、轻量级零知识证明协议在资源受限设备上的优化部署,以及多智能体协作框架中的信任机制设计。部分研究进一步将数据集扩展至联邦学习或区块链支持的物联网场景,为构建可审计、高隐私的分布式智能系统提供了关键方法论与实验依据。
数据集最近研究
最新研究方向
在物联网与边缘计算领域,随着智能设备间通信的日益频繁,数据隐私与安全成为核心挑战。zk-a2a-iot数据集聚焦于隐私保护的智能体间通信研究,其最新研究方向集中于零知识证明技术在物联网数据交换中的应用。前沿探索涉及利用该数据集训练和评估AI系统,以实现敏感信息的自动化脱敏与验证,同时保持通信上下文的完整性。热点事件如欧盟《人工智能法案》对数据隐私的强化监管,推动了此类研究在智能医疗、智慧城市等关键领域的实践。该数据集为开发可验证的隐私保护协议提供了基准,促进了物联网生态中安全、可信的分布式智能体协作,具有重要的理论与工程意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作