five

Oceanship4|水下音频数据集|海洋通信数据集

收藏
github2024-05-21 更新2024-05-31 收录
水下音频
海洋通信
下载链接:
https://github.com/lizeyujack/oceanship
下载链接
链接失效反馈
资源简介:
Oceanship4是一个大规模且多样化的水下音频数据集,包含15个类别,总时长65小时,并包含详细的标注信息如坐标、速度、船只类型和时间戳。该数据集通过爬取和整理2021至2022年间Ocean Communication Network (ONC)数据库的原始通信数据编制而成。

Oceanship4 is a large-scale and diverse underwater audio dataset, encompassing 15 categories with a total duration of 65 hours, and includes detailed annotations such as coordinates, speed, vessel type, and timestamps. This dataset was compiled by crawling and organizing raw communication data from the Ocean Communication Network (ONC) database between 2021 and 2022.
创建时间:
2024-03-30
原始信息汇总

数据集概述

数据集名称

  • Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition

数据集描述

  • 类别数量:15类
  • 总时长:65小时
  • 包含信息:坐标、速度、船只类型、时间戳等详细注释信息
  • 数据来源:Ocean Communication Network (ONC)数据库,2021至2022年间的原始通信数据
  • 数据用途:用于训练网络从音频数据中提取特征并预测船只类型,特别是在未探索的水下音频识别领域

数据集版本与获取方式

  • Oceanship(FG.)版本:https://pan.baidu.com/s/19-K_QNvINT-ZlfHzd0HuSw,密码:2fme
  • Oceanship(CG.)版本:https://pan.baidu.com/s/1FzqxKmmENbWzJUJafg9i7Q,密码:8igj
  • Oceanship(Full)版本:由Oceanship(CG.) + Oceanship(FG.)组成,未单独上传

数据集处理

  • 文件格式:原始下载文件为多个压缩文件,需通过特定命令合并解压
  • 解压步骤:使用提供的bash命令将多个压缩文件合并为一个tar文件,并解压至指定目录

数据集下载与预处理

  • 下载与预处理命令:需在特定目录执行bash jack.sh进行下载和预处理
  • 存储要求:确保磁盘有足够空间存储原始文件
  • 性能建议:推荐使用高性能计算设备进行数据爬取

增强信息

  • MMSI信息:通过爬取shipsfind艘船网获取,包含详细的船只信息,如时间、MMSI码、呼号、航向、航速、IMO编号等

致谢

  • 感谢Deepship和Shipsear的作者,以及Ocean Networks Canada - Oceans 3.0数据库的支持
  • 感谢Lucas提供的开源代码onc_dataset,本工作基于此基础
AI搜集汇总
数据集介绍
main_image_url
构建方式
Oceanship4数据集的构建基于Ocean Communication Network (ONC5)数据库,涵盖了2021至2022年间的大量原始通信数据。通过网络爬虫技术,我们系统地收集并整理了这些数据,形成了包含15个类别、总计65小时时长的高质量音频数据集。此外,数据集还附带了详尽的注释信息,包括坐标、速度、船只类型及时间戳等,确保了数据的多维度和全面性。
特点
Oceanship4数据集的显著特点在于其大规模和多样性,不仅在时长上远超现有数据集,且在样本数量和类别丰富度上亦有显著提升。该数据集的注释信息极为详尽,为研究者提供了丰富的上下文信息,有助于提升模型的识别精度和泛化能力。此外,Oceanship4还引入了基于MMSI的增强信息,进一步丰富了数据集的实用价值。
使用方法
Oceanship4数据集的获取可通过提供的链接下载不同版本的数据集文件,用户需确保具备足够的存储空间。下载后,用户需按照提供的解压和整理脚本进行操作,以获取完整的音频文件。数据集的使用建议结合高性能计算设备,以优化数据处理和模型训练效率。此外,数据集附带的增强信息文件可用于进一步的数据分析和模型优化。
背景与挑战
背景概述
在海洋通信与目标识别领域,水下音频识别技术的重要性日益凸显。Oceanship4数据集由知名研究机构于2021至2022年间创建,旨在解决现有水下音频数据集在时长和样本数量上的不足。该数据集包含了15个类别,总计65小时的音频数据,并附有详尽的注释信息,如坐标、速度、船只类型和时间戳等。通过整合Ocean Communication Network (ONC5)数据库的原始通信数据,Oceanship4不仅为水下音频识别提供了丰富的资源,还推动了相关领域技术的发展。
当前挑战
尽管Oceanship4数据集在水下音频识别领域具有显著优势,但其构建过程中仍面临诸多挑战。首先,数据获取的复杂性,包括从Ocean Communication Network (ONC5)数据库中爬取和整理原始通信数据,需要高性能计算设备的支持。其次,数据集的多样性和注释的准确性要求高,确保每条音频数据都能准确反映其所属类别和相关属性。此外,数据集的存储和处理对硬件资源提出了高要求,尤其是在处理多压缩文件和进行大规模数据预处理时。这些挑战不仅影响了数据集的构建效率,也对后续的模型训练和应用提出了更高的技术要求。
常用场景
经典使用场景
在海洋科学领域,Oceanship4数据集的经典使用场景主要集中在水下音频目标识别。该数据集通过收集和整理2021至2022年间海洋通信网络(ONC5)的原始通信数据,提供了长达65小时、涵盖15个类别的水下音频数据。这些数据不仅包括音频本身,还附有详细的注释信息,如坐标、速度、船只类型和时间戳。Oceanship4数据集的引入,使得研究人员能够训练和验证用于水下音频分类的模型,从而提升对水下船只的识别能力。
衍生相关工作
基于Oceanship4数据集,一系列相关研究工作得以展开。例如,Oceannet模型的提出,通过利用Oceanship数据集进行训练,实现了在水下音频检索任务中的高精度识别。此外,该数据集还激发了其他研究者开发新的水下音频处理算法和模型,进一步推动了水下通信和海洋监测技术的发展。Oceanship4的成功应用,也为后续数据集的构建和研究提供了宝贵的经验和参考,促进了水下音频识别领域的持续进步。
数据集最近研究
最新研究方向
在海洋科技与声学识别领域,Oceanship4数据集的引入标志着水下音频目标识别技术的新里程碑。该数据集不仅规模庞大,涵盖了15种不同类型的水下船只音频,总时长达到65小时,还提供了详尽的注释信息,如坐标、速度、船只类型和时间戳。这些特性使得Oceanship4成为研究水下音频识别的理想平台。当前,基于Oceanship4的研究主要集中在开发高效的音频特征提取算法和构建精准的识别模型,如Oceannet,其在Deepship数据集上的表现已显示出显著的潜力。此外,结合MMSI信息进行增强分析,进一步提升了数据集的应用价值,预示着未来水下目标识别技术将更加智能化和精准化。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

2000-2018年中国典型生态系统植物生长节律数据

该数据集涵盖了森林、草地、荒漠、沼泽、农田生态系统2000年-2020年CERN长期定位监测的植物物候数据和主要作生育期数据,包括木本植物、草本植物、水稻、小麦、玉米物候数据表,木本植物数据表有18个台站、291个物种的芽开放期、展叶期、开花始期、开花盛期、果实或种子成熟期、叶秋季变色期和落叶期共计3814条记录;草本植物数据表有22个台站、312个物种的萌动期、开花期、果实或种子成熟期、种子散布期和黄枯期共计3032条数据;水稻数据表有9个台站的出苗期、拔节期、蜡熟期等10个生育期共551条记录;小麦数据表有9个台站不同生育期382条记录;玉米数据表有18个台站不同生育期532条数据。

地球大数据科学工程 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录