five

HiXray|X光安检数据集|违禁品检测数据集

收藏
arXiv2021-08-23 更新2024-06-21 收录
X光安检
违禁品检测
下载链接:
https://github.com/HiXray-author/HiXray
下载链接
链接失效反馈
资源简介:
HiXray数据集是由软件开发环境国家重点实验室创建,包含102,928个来自国际机场日常安检的X光图像,涵盖8类常见违禁品。数据集中的每个实例均由专业安检人员手动标注,确保标注的准确性。该数据集适用于多种检测任务,如小型和遮挡物体检测,旨在提高X光安检中违禁品检测的准确性和效率。
提供机构:
软件开发环境国家重点实验室
创建时间:
2021-08-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
HiXray数据集的构建始于对现实世界机场安检场景的深入理解,其数据源自真实机场安检过程中的日常检查。为了保证数据的质量和真实性,所有图像均由专业的安检人员进行了手动标注。HiXray数据集包含了102,928个常见违禁物品实例,这些物品被分为8个类别,如锂离子电池、液体、打火机等。为了保证数据隐私,所有图像都经过了脱敏处理,确保无法通过图像识别出行李的所有者。此外,HiXray数据集的构建还考虑了数据的多样性和质量控制,以确保数据集能够满足实际应用的需求。
使用方法
HiXray数据集的使用方法相对简单。首先,用户需要将数据集下载到本地,然后可以使用图像处理软件对其进行查看和处理。其次,用户可以使用深度学习框架对数据集进行训练,以构建违禁物品检测模型。在训练过程中,用户可以根据需要对数据集进行分割,以便进行训练和测试。此外,用户还可以使用数据集进行其他任务的研究,如小物体检测、遮挡物体检测等。为了方便用户使用,数据集的官方网站还提供了相关的文档和代码,以帮助用户更好地理解和应用数据集。
背景与挑战
背景概述
X射线图像中的违禁物品检测对于公共安全至关重要,但由于缺乏专门的、高质量的数据集,相关研究一直相对较少。HiXray数据集由北京航空航天大学、科大讯飞研究院和中国科学院软件研究所的研究人员于2021年创建,旨在解决这一问题。该数据集包含102,928个常见违禁物品的8个类别,是从真实世界机场安检中收集并经专业安检员标注的。HiXray数据集是目前为止最大的、高质量的违禁物品检测数据集,为相关领域的研究提供了新的、合理的评估基准,并促进了违禁物品检测在X射线安检领域的发展。
当前挑战
HiXray数据集和相关模型面临的主要挑战包括:1)违禁物品检测领域的问题:X射线图像中物品常常随机重叠,导致图像中噪声较大,对检测模型的性能要求较高;2)构建数据集过程中的挑战:由于X射线图像的特殊性,需要确保数据集的真实性、隐私性、多样性和标注的准确性。此外,由于违禁物品在X射线图像中缺乏明显的识别特征,如何提高检测模型的鲁棒性和准确性也是一大挑战。
常用场景
经典使用场景
在X光图像中检测违禁物品是保障公共安全的重要任务,HiXray数据集作为目前最大的高质量X光违禁物品检测数据集,为相关研究提供了丰富的真实场景数据。该数据集包含来自国际机场日常安检的真实X光图像,由专业安检人员进行标注,确保了数据的质量和实用性。HiXray数据集广泛应用于违禁物品检测模型训练和评估,帮助研究人员开发出更加准确和高效的违禁物品检测系统。
解决学术问题
HiXray数据集解决了X光图像违禁物品检测中缺乏高质量数据集的问题。现有公开的X光数据集在数量、类别和标注质量上均无法满足实际应用的需求。HiXray数据集的发布为X光违禁物品检测领域的研究提供了新的基准,推动了该领域的发展。此外,HiXray数据集的多样性和高质量标注为研究小物体检测、遮挡物体检测等任务提供了数据基础。
实际应用
HiXray数据集在实际应用中具有重要意义。通过使用HiXray数据集训练的违禁物品检测模型,可以有效提高安检效率,降低安检人员的工作强度,同时确保公共安全。此外,HiXray数据集还可以应用于其他领域,如医学图像分析、工业检测等,具有广泛的应用前景。
数据集最近研究
最新研究方向
随着公共安全需求的日益增长,X射线安检图像中违禁物品的检测变得至关重要。HiXray数据集的提出为这一领域带来了突破性的进展。该数据集收集了来自真实世界机场安检的高质量X射线图像,并经过专业安检人员的标注,为违禁物品检测提供了迄今为止最大的数据集。此外,HiXray数据集还支持各种检测任务,包括小型和遮挡物体的检测,为研究人员提供了更广泛的应用场景。为了提高违禁物品检测的准确性,研究人员还提出了侧抑制模块(LIM)。LIM通过双向传播模块最大限度地抑制噪声信息,并通过边界激活模块从四个方向激活最易识别的边界信息。在HiXray和OPIXray数据集上的评估结果表明,LIM不仅能够超越现有的检测方法,还能显著提高其性能。HiXray数据集和LIM模型的提出,为违禁物品检测领域的研究提供了新的评估基准,并有助于推动该领域在现实世界中的应用。
相关研究论文
  • 1
    Towards Real-world X-ray Security Inspection: A High-Quality Benchmark and Lateral Inhibition Module for Prohibited Items Detection软件开发环境国家重点实验室 · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。

www.ngac.org.cn 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

中国车牌识别数据集(7类,33万张)

这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。

魔搭社区 收录