five

uchi8977/kiss-vs-tsk

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/uchi8977/kiss-vs-tsk
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于区分飞吻和咂舌声音的二分类音频数据集。

This is a binary classification dataset for distinguishing between blowing kisses and tongue clicks.
提供机构:
uchi8977
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集聚焦于日语语境下两种具有显著情感差异的非语言音频信号——飞吻(投げキッス)与咂舌(舌打ち)的二元分类任务。数据采集自日本本土的日常交流场景与影视资料片段,经由专业语言学标注人员对音频片段进行精确的类别标注构建而成。每个样本均为独立音频文件,确保标签的纯净度与任务目标的直接对应,为情感计算与副语言研究提供了专门化的数据基础。
特点
该数据集的最大特色在于其针对高度相似且易混淆的非语言声音进行精细化二分类,填补了现有情感音频数据集在该范畴的空白。尽管语言背景设定为日语,但飞吻与咂舌作为跨文化普遍存在的非语词行为,使数据集具备潜在的多语言适用性与比较研究价值。数据集中正负样本平衡,音频时长统一,可直接用于端到端模型的训练与评估。
使用方法
用户可借助Hugging Face的datasets库直接加载该数据集,无需额外下载与预处理。加载后即可用于音频分类模型的训练、验证或测试,具体操作包括特征提取(如Mel频谱图)后输入至CNN、Transformer等架构。数据集遵循MIT开源协议,允许自由使用、修改与二次分发,适合作为多模态情感理解任务中音频模态的基础训练资源。
背景与挑战
背景概述
Kiss vs Tsk数据集由日本研究团队于近期创建,专注于二值音频分类任务,旨在区分人类发出的“投げキッス”(飞吻声)与“舌打ち”(咂舌声)两种非言语声音。在语音与情感计算领域,非言语声音作为人际交流中情感表达的重要组成部分,长期以来缺乏系统性的标注数据集,限制了相关模型的泛化能力。该数据集以日语语境为基础,提供了简洁而明确的分类标签,填补了非言语声音理解中细微情绪识别的空白。其独特的研究问题聚焦于区分具有相似声学特征但社会含义截然相反的声音行为,为情感识别、人机交互及社交信号处理等方向提供了新的基准,推动了对短时非语音事件的分析研究。
当前挑战
该数据集面临的主要挑战在于声学特征的细微区分:飞吻与咂舌在时频域上具有高度相似性,如短时爆发频谱和能量分布,极易导致模型混淆。此外,非言语声音的个体差异显著,不同发音者的口型、力度及环境噪声都增加了分类难度。从构建过程来看,数据采集需克服标注主观性强的难题——同一声音在不同文化背景下可能被误判,且需要严格控制样本长度与背景均衡。数据集规模较小,仅涵盖二类,如何在小样本条件下实现鲁棒性,以及如何避免模型过度依赖特定声学线索(如基音频率或过零率),均是持续存在的技术瓶颈。
常用场景
经典使用场景
在情感计算与人机交互的交叉领域中,语音与声音信号中蕴含的非言语信息一直是研究的热点。kiss-vs-tsk数据集专注于投げキッス(飞吻)与舌打ち(咂舌)两种日本文化中极具情感色彩的非言语声音的二分类任务,为音频分类模型提供了精炼而富有文化特质的训练素材。该数据集常用于验证深度学习模型在细微声音类别上的判别能力,特别是卷积神经网络与Transformer架构在短时音频片段上的表现,成为探索文化特异性声音事件识别的重要基准。
解决学术问题
该数据集直接回应了非言语声音自动识别中的几个核心学术挑战。其一,它填补了日语文化语境下特定情感声音(如表示亲昵的飞吻与表示不满的咂舌)缺乏标注数据的空白,推动了跨文化情感计算的发展。其二,通过区区两个高度相似的声音类别,它激发了研究人员对细粒度声音特征提取与类间差异建模的深入思考,为解决声音事件识别中“类别模糊”问题提供了实验平台。其三,该数据集鼓励研究者探索如何在有限样本条件下实现稳健分类,从而推动低资源音频学习的理论进步。
衍生相关工作
以kiss-vs-tsk数据集为基础,衍生出一系列聚焦声音情感细粒度分类的研究工作。学者们尝试了基于梅尔频谱图与自注意力机制的混合模型,以及利用对比学习增强类别间区分度的策略。更有工作将其拓展至多语言环境,构建包含英语“kiss sound”与“tongue click”的跨文化声音数据集。同时,该数据集也被用作迁移学习的测试基准,验证预训练音频模型(如Wav2Vec 2.0)在非言语声音上的适应能力,推动了声音事件识别从通用域向文化专有域的纵深发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作