five

Wireless AI Research Dataset (WAIR-D)|无线通信数据集|AI研究数据集

收藏
arXiv2022-12-05 更新2024-06-21 收录
无线通信
AI研究
下载链接:
https://www.mobileaidataset.com/html/default/yingwen/DateSet/1590994253188792322.html?index=1
下载链接
链接失效反馈
资源简介:
Wireless AI Research Dataset (WAIR-D) 是由华为技术有限公司无线技术实验室与浙江大学合作创建的无线AI研究数据集。该数据集包含两个场景:场景1包含10,000个环境,每个环境中有稀疏分布的用户设备(UEs);场景2包含100个环境,每个环境中有密集分布的UEs。这些环境是从全球40多个城市的真实世界地图中随机选取的,确保了数据集的多样性和真实性。数据集不仅提供了无线信道数据,还包括相应的环境信息,支持环境无关和环境相关的AI任务。WAIR-D的应用领域广泛,主要用于无线通信系统中AI模型的设计、训练和评估,旨在解决无线通信中的环境重建和波束预测等问题。
提供机构:
华为技术有限公司无线技术实验室
创建时间:
2022-12-05
AI搜集汇总
数据集介绍
构建方式
Wireless AI Research Dataset (WAIR-D)的构建采用了3D射线追踪模拟器PyLayers,以真实世界地图为输入,生成了包含无线信道和相应环境信息的数据集。该数据集包括两种场景:场景1包含10,000个稀疏分布用户设备的环境,场景2包含100个密集分布用户设备的环境。数据集构建过程中,基站和用户设备的位置信息被记录,同时模拟了不同传播路径的无线电传播路径。
使用方法
使用WAIR-D时,用户可以根据需要生成特定无线系统参数的信道数据。数据集提供了原始数据、示例任务和用户自定义数据生成的脚本。用户可以通过这些脚本加载路径延迟、到达角、离开角和路径响应等信息,进而计算信道频率响应。此外,数据集还支持基于提供的数据进行环境重建和空间波束预测等任务。
背景与挑战
背景概述
无线通信领域融合人工智能技术已成为研究热点,然而,缺乏统一的、多样化的数据集,导致相关研究成果难以比较和验证。在此背景下,华为技术有限公司和浙江大学联合研发了Wireless AI Research Dataset (WAIR-D)数据集。该数据集包含两种场景,分别针对稀疏和密集的用户设备分布,采用3D射线追踪技术模拟真实世界的无线传播路径,为人工智能在无线通信系统中的应用提供了丰富的实验基础。
当前挑战
WAIR-D数据集在构建过程中面临的主要挑战包括:确保数据集的多样性和真实性,以提升模型的泛化能力;同时,数据集构建过程中还需考虑不同无线系统参数下的信道数据生成,以适应各种应用场景。具体挑战包括:1)如何在多样化的环境中保持数据集的统一性和可比性;2)如何生成能够反映真实世界复杂性的信道模型;3)如何高效地利用数据集进行模型训练和评估。
常用场景
经典使用场景
WAIR-D数据集的典型应用场景在于无线通信系统中的人工智能算法研究和评估。该数据集提供了多样化的环境设置,使得AI模型可以在不同的环境下进行训练和测试,从而确保了良好的泛化能力。经典的使用场景包括无线环境重建和空间波束预测等任务。
解决学术问题
WAIR-D数据集解决了无线通信领域中缺乏统一标准数据集的问题。传统的无线AI研究多依赖于统计模型或射线追踪模拟生成的数据,这些数据限制了AI模型的进一步微调和泛化能力。WAIR-D通过提供真实世界地图生成的环境信息和无线信道数据,使得研究人员能够设计并评估额外的信息辅助通信机制,从而提升了学术研究的深度和广度。
实际应用
在实际应用中,WAIR-D数据集可用于训练AI模型以预测无线信道特性,优化网络调度,以及进行资源管理。这些应用能够帮助无线通信系统更好地适应复杂多变的环境,提高通信效率和网络性能。
数据集最近研究
最新研究方向
无线AI研究领域近期专注于Wireless AI Research Dataset (WAIR-D)的构建与应用。该数据集通过三维射线追踪模拟器PyLayers,生成包含真实世界地图环境信息的无线传播路径数据,旨在为无线AI算法研究提供高质量的训练和测试平台。WAIR-D包含两种场景,分别为稀疏用户设备分布的场景1和密集用户设备分布的场景2,以支持不同算法对泛化能力的评估。近期研究不仅展示了该数据集在环境重建和空间波束预测任务中的应用示例,还验证了基于少量样本的迁移学习在提高预测准确性方面的有效性,为无线通信系统的AI算法研究和应用提供了新的视角和方法论。
相关研究论文
  • 1
    WAIR-D: Wireless AI Research Dataset华为技术有限公司无线技术实验室 · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)

这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。

OpenDataLab 收录

WideIRSTD Dataset

WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。

github 收录