ASMR_Dataset

Hugging Face2025-03-13 更新2025-03-14 收录

下载链接：

https://huggingface.co/datasets/OOPPEENN/ASMR_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个经过手动清理和自动处理的多媒体数据集，包括视频字幕和对应的音频。数据集中的字幕经过筛选，确保包含中文字幕，并且时间戳正确对齐。通过使用mel band roformer模型，数据集中的音频去除了背景杂音，如SE（特效声）、BGM（背景音乐）、口水声等。数据集还通过分离左右声道并识别出最响亮的声道来进一步处理音频数据，最终创建了索引以便于使用。

This dataset is a manually cleaned and automatically processed multimedia dataset containing video subtitles and their corresponding audio. The subtitles in the dataset have been filtered to ensure they include Chinese subtitles with correctly aligned timestamps. Utilizing the mel band RoFormer model, the audio in the dataset has been denoised to remove background noises such as sound effects (SE), background music (BGM), and saliva sounds. The dataset further processes the audio data by separating the left and right audio channels and identifying the loudest channel, and finally creates indexes for easy access and utilization.

创建时间：

2025-03-03

搜集汇总

数据集介绍

构建方式

ASMR_Dataset的构建过程始于对原始视频资源的细心筛选与清洗。首先，通过人工清洗去除不含中文字幕、字幕时间戳连续排列错误或时间戳未对齐的样本。随后，利用mel band roformer技术移除背景噪声，如SE、BGM、口水声等。进而，对字幕进行解析，并对音频进行切割处理。接着，将立体声道的左右声道分离，并使用anime-whisper工具识别出响度较大的声道。最后，创建索引以便于数据集的使用。

特点

本数据集的特点在于其高质量的音频与字幕同步，经过精细处理，保证了数据集的可用性和准确性。通过专门设计的预处理流程，数据集在消除背景噪音和识别清晰语音方面具有显著优势，为ASMR相关研究提供了可靠的资源。同时，数据集的构建遵循GPL-3.0协议，确保了数据的开放性和共享性。

使用方法

使用ASMR_Dataset时，用户可以依据索引方便地访问和处理数据。由于数据集已进行声道分离，研究者可以根据具体需求选择合适的声道进行分析。此外，数据集的开放协议使得用户在使用数据集时，能够明确其使用的法律和伦理责任，保障研究的合规性。

背景与挑战

背景概述

ASMR_Dataset是一个专注于 Autonomous Sensory Meridian Response（ASMR）现象的研究数据集，旨在为ASMR相关研究提供高质量的中文字幕与音频资源。该数据集的创建体现了近年来ASMR领域在全球范围内的研究兴趣日益增长，由相关研究人员和机构于近期开发完成，其核心研究问题聚焦于如何准确识别和量化ASMR音频中的关键特征。ASMR_Dataset的出现为相关领域的研究提供了宝贵的实验资源，对推动ASMR现象的机理研究及其应用发展产生了重要影响。

当前挑战

ASMR_Dataset在构建过程中面临了诸多挑战，其中包括：确保数据集中音频与字幕的准确对应，这要求对字幕时间戳进行精确对齐；在音频处理阶段，有效去除背景噪音、SE（Sound Effects）、BGM（Background Music）以及口水声等干扰元素；此外，数据集中音频通道的选择也面临挑战，需通过识别算法确定最清晰的通道。在领域问题上，ASMR_Dataset解决了如何高效标注和分类ASMR音频的难题，但同时也面临着如何提高识别准确率和扩展数据集规模以满足多样化研究需求的挑战。

常用场景

经典使用场景

在语音信号处理与自动语音识别领域，ASMR_Dataset以其独特的构成成为研究者的首选。该数据集通过精细的预处理流程，如手动清洗、去除非中文字幕、校正时间戳等，确保了数据的质量与可用性。经典的使用场景包括对语音信号进行增强，以及通过语音分离技术提取特定声道的信息，进而进行语音识别与合成。

衍生相关工作

基于ASMR_Dataset，研究者们已开展了一系列相关工作，如利用该数据集优化语音分离算法、改进语音识别引擎等。此外，也有研究通过该数据集探索语音信号处理的新方法，推动了语音技术在多模态交互领域的应用发展。

数据集最近研究