MILD(Multi-smartphone Indoor Localization Dataset)
收藏github2025-07-04 更新2025-07-15 收录
下载链接:
https://github.com/Intelligent-Perception-Lab/MILD
下载链接
链接失效反馈官方服务:
资源简介:
MILD(多智能手机室内定位数据集)是一个开源的Wi-Fi室内定位数据集,收集自多个用户和智能手机。它包含用于定位目的的RSSI、CSI数据以及相应的2-D位置标签。
MILD (Multi-Smartphone Indoor Localization Dataset) is an open-source Wi-Fi indoor localization dataset collected from multiple users and smartphones. It includes RSSI and CSI data for localization purposes, along with corresponding 2-D position labels.
创建时间:
2025-07-04
原始信息汇总
MILD(Multi-smartphone Indoor Localization Dataset) 数据集概述
数据集背景
- 目的:解决现有室内定位研究中缺乏真实通信设备验证的问题
- 特点:包含来自多用户和多智能手机的Wi-Fi室内定位数据
- 数据类型:同时包含RSSI、CSI数据和对应的2D位置标签
数据集组成
硬件配置
-
智能手机
- 数量:22部(21种不同型号)
- 品牌分布:
- iPhone:11/12/13/13 Mini/14/14 Pro/15 Pro Max
- XIAOMI:8 SE/13(×2)/14/Redmi K20 Pro/K30S Ultra/K40/Note 12-Turbo
- 其他品牌:Honor X10/60/Magic 4 Pro/Oneplus Ace2/Huawei Mate10/Meizu 16s/Pixel 4
-
接入点(APs)
- 型号:H3C WA6520和WA6522H-HI
- 技术参数:
型号 天线数量 天线间距 工作频段 6520 2 7.47cm 5GHz 6522H-HI 2 3.3cm 5GHz
-
超宽带(UWB)系统
- 组成:4个锚点和1个标签
- 用途:提供厘米级精度的地面真实轨迹数据
数据采集
- 时间同步:使用NTP协议同步AP和UWB系统
- 采集方式:
- 志愿者佩戴装有UWB标签的头盔
- 在指定区域内自由移动时手持智能手机
数据详情
| 数据类型 | 数据格式 | 描述 |
|---|---|---|
| timestamps | packet_num x 1 double | 数据采集时间戳 |
| rssi | packet_num x 2 double | 信号强度指示值 |
| csi_data | 1 x packet_num cell | 空间信息CSI值 |
| channel | packet_num x 1 double | 数据采集信道 |
| center_freq | packet_num x 1 double | 子载波中心频率 |
| ap_names | packet_num x 1 double | 数据采集AP名称 |
| coords | packet_num x 2 double | UWB提供的坐标(地面真实值) |
获取方式
- 签署数据发布协议
- 中国研究人员:需加盖机构公章
- 非中国研究人员:需由负责人签字
- 将签署文件发送至:wangguanz@mail.ustc.edu.cn
- 7个工作日内将通过邮件发送下载链接
相关数据集
搜集汇总
数据集介绍

构建方式
MILD数据集作为多智能手机室内定位领域的重要资源,其构建过程体现了严谨的工程设计与科学验证。研究团队采用22款不同厂商的商用智能手机,通过15名志愿者在真实室内环境中进行数据采集。数据采集系统由部署在建筑物内的商用AP(H3C WA6520和6522H-HI型号)、高精度UWB定位基站以及时间同步网络组成。志愿者佩戴集成UWB标签的头盔自由移动,同步采集Wi-Fi信号强度(RSSI)、信道状态信息(CSI)以及UWB提供的厘米级精度坐标真值。所有设备通过NTP协议实现微秒级时间同步,确保多模态数据的时空对齐。
特点
该数据集的核心价值在于其真实性和多样性。硬件配置涵盖21种智能手机型号和两种不同天线结构的商用AP,完整保留了实际通信场景中的设备异构性特征。数据维度包含时间戳、RSSI值、CSI矩阵、信道编号等完整信号特征,配合UWB提供的毫米级精度三维坐标,构成室内定位研究的多模态基准。特别值得注意的是,数据集捕捉了真实通信数据包与探测数据包的特征差异,以及不同手机厂商硬件实现对CSI测量的影响,这些特性使其区别于传统基于专用接收器的仿真数据集。
使用方法
研究者可通过签署数据使用协议获取该数据集,中国境内机构需加盖公章,境外机构需负责人签字。数据集采用MATLAB兼容格式组织,包含按数据包编号的时间戳序列、2×2 RSSI矩阵、CSI单元阵列等结构化数据。使用时应特别注意UWB坐标与Wi-Fi数据的时间对齐问题,建议先进行数据清洗和时域校准。该数据集适用于基于深度学习的跨设备定位算法验证、多AP协同定位研究等场景,相关预处理代码可参考GitHub页面的示例脚本。
背景与挑战
背景概述
MILD(Multi-smartphone Indoor Localization Dataset)是由中国科学技术大学智能感知实验室于近年推出的开源Wi-Fi室内定位数据集,旨在推动基于商用设备的室内定位技术研究。该数据集由15名志愿者使用22种不同型号的智能手机采集,包含RSSI和CSI数据以及对应的二维坐标标签。与传统的基于专用硬件设备(如Intel 5300网卡)的定位研究不同,MILD聚焦于真实商用环境下的定位挑战,其创新性体现在采用商用接入点(AP)和现成智能手机作为数据采集设备,更贴近实际应用场景。该数据集的发布为研究异构设备兼容性、通信数据模式对信道状态信息(CSI)的影响等关键问题提供了重要实验平台,对促进室内定位技术从实验室走向实际应用具有显著意义。
当前挑战
MILD数据集主要应对室内定位领域的两大核心挑战:其一是在真实商用环境下实现高精度定位的技术难题,包括商用AP天线数量有限导致的角度信息缺失、通信数据包与探测数据包的模式差异、以及不同智能手机硬件实现带来的CSI测量偏差等问题;其二是数据集构建过程中的技术挑战,涉及多设备时间同步、异构智能手机的CSI特征标定、基于UWB的地面实轨迹获取等关键环节。特别是需要解决商用AP天线间距较大导致的AoA特征提取困难,以及不同厂商智能手机硬件差异引起的CSI测量不一致性等特殊问题,这些挑战使得基于商用设备的室内定位研究具有显著区别于传统方法的复杂性。
常用场景
经典使用场景
在室内定位领域,MILD数据集以其多智能手机、多用户的数据采集方式,成为研究Wi-Fi信号特征与位置关系的经典资源。该数据集通过整合RSSI和CSI数据,为研究者提供了丰富的信号特征分析基础,尤其在复杂室内环境中验证定位算法的鲁棒性方面表现突出。
解决学术问题
MILD数据集有效解决了现有研究中商业智能手机与专用设备数据差异带来的泛化性问题。通过覆盖21种设备类型和15名志愿者的多样化数据,该数据集为探索通信数据包特性、天线配置差异对CSI的影响提供了实证基础,推动了基于商用AP的定位技术从理论向实际应用的过渡。
衍生相关工作
基于MILD数据集的研究催生了多项创新成果,如《RLoc》提出的鲁棒定位框架和《Learning domain-invariant model》中的跨设备泛化方法。这些工作通过挖掘数据集中多设备CSI特征,推动了对抗样本防御、领域自适应等方向的发展,形成了室内定位领域新的研究范式。
以上内容由遇见数据集搜集并总结生成



