ais_abnormal
收藏Hugging Face2025-04-07 更新2025-04-08 收录
下载链接:
https://huggingface.co/datasets/PassbyGrocer/ais_abnormal
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含交通驾驶行为分类的数据集,包含五种行为类别:正常、循环、掉头、绕行和噪声聚类。数据集由四个特征组成:input_ids、labels、attention_mask和feature,每个特征序列长度为100。数据集分为训练集和测试集,训练集有202个样本,测试集有51个样本。
This is a dataset for traffic driving behavior classification, encompassing five behavior categories: normal, looping, U-turn, detouring, and noise clustering. The dataset comprises four features: input_ids, labels, attention_mask, and feature, with each feature sequence having a length of 100. The dataset is split into a training set and a test set, containing 202 samples in the training set and 51 samples in the test set.
创建时间:
2025-04-05
搜集汇总
数据集介绍

构建方式
ais_abnormal数据集聚焦于船舶自动识别系统(AIS)中的异常行为检测,其构建过程体现了对海上交通模式深度解析的追求。研究团队通过采集真实AIS数据流,采用滑动窗口技术将连续轨迹分割为100个时间步长的序列片段,每个片段包含9维特征向量。异常标签由海事专家根据国际海事组织标准人工标注,涵盖正常航行、循环移动、U型转弯、绕行、噪声聚类和填充六种状态,最终形成包含253个样本的平衡数据集,其中训练集202例,测试集51例。
特点
该数据集在时空特征表征方面具有显著优势,每个样本包含100个时间步的序列数据,每个时间步整合了9维特征向量和对应的注意力掩码。异常分类体系设计科学,不仅包含典型的异常航行模式如循环移动和U型转弯,还创新性地引入了噪声聚类这一现实场景常见干扰类型。数据以32位浮点数和整型格式存储,在保持精度的同时优化了存储效率,整体数据集大小控制在2.1MB左右,兼顾了深度学习模型训练的需求和计算资源消耗的平衡。
使用方法
使用ais_abnormal数据集时,建议采用时序深度学习架构进行处理。输入层应兼容100×9的特征矩阵,配合对应的注意力掩码过滤无效填充数据。输出层对应六分类任务,可采用交叉熵损失函数进行优化。数据集已预分为训练集和测试集,研究者可直接加载HuggingFace提供的默认配置进行端到端训练。对于小样本场景,可利用迁移学习策略,将预训练模型在该数据集上进行微调,特别注意处理类别不平衡问题,以准确识别各类异常航行模式。
背景与挑战
背景概述
ais_abnormal数据集专注于船舶自动识别系统(AIS)数据的异常行为检测研究,由海事数据分析领域的专业团队构建。该数据集旨在解决海上交通管理中异常航行模式识别的核心问题,涵盖正常航行、循环航行、U型转弯、绕行、噪声集群及填充等多种行为类别。通过提供结构化序列数据和精细标注,ais_abnormal为智能航运系统中的轨迹预测、风险预警等关键技术提供了重要基准,推动了海事安全领域的算法创新与应用落地。
当前挑战
该数据集面临的挑战主要体现在两方面:在领域问题层面,船舶异常行为具有高度动态性和上下文依赖性,传统基于规则的方法难以有效区分复杂场景下的伪装异常与正常航行模式;在数据构建层面,原始AIS数据存在信号丢失、坐标漂移和采样频率不均等问题,需开发专用清洗算法以保证轨迹片段的质量。同时,多类别样本不平衡现象(如噪声集群与正常航行样本量差异)对模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在船舶自动识别系统(AIS)数据分析领域,ais_abnormal数据集为研究异常航行模式提供了标准化的基准。该数据集通过标记六种不同类型的航行行为(如正常航行、循环航行、U型转弯等),成为评估轨迹异常检测算法的黄金标准。研究者可利用其多维特征(包括输入序列、注意力掩码和特征向量)开发端到端的深度学习模型,特别适合处理长序列时空轨迹数据的分类任务。
衍生相关工作
基于ais_abnormal的基线性能,学术界涌现出多项创新工作。Transformer-XL架构的时空适配版本在该数据集上验证了长序列建模优势,后续研究则开发了融合图神经网络的混合模型以提升U-turn识别准确率。部分团队进一步扩展了原始标签体系,新增了锚泊异常等子类别,推动形成了更完备的海事异常行为分类标准。
数据集最近研究
最新研究方向
在船舶自动识别系统(AIS)数据分析领域,ais_abnormal数据集因其对异常航行模式的精细标注而备受关注。该数据集聚焦于六类典型异常行为检测,包括常规航行、循环航行、U型转弯、绕行、噪声集群及填充数据,为智能航运监管与海上交通安全研究提供了关键数据支持。当前前沿研究主要围绕多模态时序特征融合与轻量化异常检测算法展开,结合注意力机制与图神经网络技术,显著提升了复杂海况下异常模式的识别准确率。近期国际海事组织(IMO)对智能航运安全标准的修订,进一步推动了该数据集在船舶行为预测与自主避碰系统中的应用,相关成果已逐步应用于欧盟智慧港口建设项目。
以上内容由遇见数据集搜集并总结生成



