Nexdata/Infant_Laugh_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Infant_Laugh_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
---
YAML tags:
- copy-paste the tags obtained with the tagging app: https://github.com/huggingface/datasets-tagging
---
# Dataset Card for Nexdata/Infant_Laugh_Speech_Data_by_Mobile_Phone
## Table of Contents
- [Table of Contents](#table-of-contents)
- [Dataset Description](#dataset-description)
- [Dataset Summary](#dataset-summary)
- [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards)
- [Languages](#languages)
- [Dataset Structure](#dataset-structure)
- [Data Instances](#data-instances)
- [Data Fields](#data-fields)
- [Data Splits](#data-splits)
- [Dataset Creation](#dataset-creation)
- [Curation Rationale](#curation-rationale)
- [Source Data](#source-data)
- [Annotations](#annotations)
- [Personal and Sensitive Information](#personal-and-sensitive-information)
- [Considerations for Using the Data](#considerations-for-using-the-data)
- [Social Impact of Dataset](#social-impact-of-dataset)
- [Discussion of Biases](#discussion-of-biases)
- [Other Known Limitations](#other-known-limitations)
- [Additional Information](#additional-information)
- [Dataset Curators](#dataset-curators)
- [Licensing Information](#licensing-information)
- [Citation Information](#citation-information)
- [Contributions](#contributions)
## Dataset Description
- **Homepage:** https://www.nexdata.ai/datasets/1090?source=Huggingface
- **Repository:**
- **Paper:**
- **Leaderboard:**
- **Point of Contact:**
### Dataset Summary
Laugh sound of 20 infants and young children aged 0~3 years old, a number of paragraphs from each of them; It provides data support for detecting children's laugh sound in smart home projects.
For more details, please refer to the link: https://www.nexdata.ai/datasets/1090?source=Huggingface
### Supported Tasks and Leaderboards
automatic-speech-recognition, audio-speaker-identification: The dataset can be used to train a model for Automatic Speech Recognition (ASR).
### Languages
Infant Cry
## Dataset Structure
### Data Instances
[More Information Needed]
### Data Fields
[More Information Needed]
### Data Splits
[More Information Needed]
## Dataset Creation
### Curation Rationale
[More Information Needed]
### Source Data
#### Initial Data Collection and Normalization
[More Information Needed]
#### Who are the source language producers?
[More Information Needed]
### Annotations
#### Annotation process
[More Information Needed]
#### Who are the annotators?
[More Information Needed]
### Personal and Sensitive Information
[More Information Needed]
## Considerations for Using the Data
### Social Impact of Dataset
[More Information Needed]
### Discussion of Biases
[More Information Needed]
### Other Known Limitations
[More Information Needed]
## Additional Information
### Dataset Curators
[More Information Needed]
### Licensing Information
Commerical License: https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
### Citation Information
[More Information Needed]
### Contributions
YAML 标签:
- 粘贴通过标签应用工具获取的标签:https://github.com/huggingface/datasets-tagging
# 数据集卡片:Nexdata/移动端采集婴幼儿笑声语音数据集
## 目录
- [目录](#目录)
- [数据集描述](#数据集描述)
- [数据集概述](#数据集概述)
- [支持任务与排行榜](#支持任务与排行榜)
- [语言](#语言)
- [数据集结构](#数据集结构)
- [数据实例](#数据实例)
- [数据字段](#数据字段)
- [数据划分](#数据划分)
- [数据集构建](#数据集构建)
- [策展依据](#策展依据)
- [源数据](#源数据)
- [标注信息](#标注信息)
- [个人与敏感信息](#个人与敏感信息)
- [数据使用注意事项](#数据使用注意事项)
- [数据集的社会影响](#数据集的社会影响)
- [偏差讨论](#偏差讨论)
- [其他已知局限性](#其他已知局限性)
- [附加信息](#附加信息)
- [数据集策展人](#数据集策展人)
- [授权信息](#授权信息)
- [引用信息](#引用信息)
- [贡献](#贡献)
## 数据集描述
- **主页**:https://www.nexdata.ai/datasets/1090?source=Huggingface
- **代码仓库**:
- **相关论文**:
- **排行榜**:
- **联系方式**:
### 数据集概述
本数据集包含20名0~3岁婴幼儿的笑声片段,每名婴幼儿均提供多段笑声数据;可为智能家居项目中的儿童笑声检测任务提供数据支撑。更多细节请参考链接:https://www.nexdata.ai/datasets/1090?source=Huggingface
### 支持任务与排行榜
自动语音识别、音频说话人识别:本数据集可用于训练自动语音识别(Automatic Speech Recognition,ASR)模型。
### 语言
婴儿啼哭声
## 数据集结构
### 数据实例
[需补充更多信息]
### 数据字段
[需补充更多信息]
### 数据划分
[需补充更多信息]
## 数据集构建
### 策展依据
[需补充更多信息]
### 源数据
#### 初始数据收集与标准化
[需补充更多信息]
#### 源语言生产者是谁?
[需补充更多信息]
### 标注信息
#### 标注流程
[需补充更多信息]
#### 标注人员是谁?
[需补充更多信息]
### 个人与敏感信息
[需补充更多信息]
## 数据使用注意事项
### 数据集的社会影响
[需补充更多信息]
### 偏差讨论
[需补充更多信息]
### 其他已知局限性
[需补充更多信息]
## 附加信息
### 数据集策展人
[需补充更多信息]
### 授权信息
商业授权:https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
### 引用信息
[需补充更多信息]
### 贡献
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
Nexdata/Infant_Laugh_Speech_Data_by_Mobile_Phone
数据集描述
数据集摘要
本数据集包含20名0至3岁婴幼儿的笑声,旨在为智能家居项目中的儿童笑声检测提供数据支持。
支持的任务和排行榜
- 自动语音识别 (ASR)
- 音频说话人识别
语言
- 婴儿哭声
数据集结构
数据实例
[信息待补充]
数据字段
[信息待补充]
数据分割
[信息待补充]
数据集创建
数据选择理由
[信息待补充]
源数据
初始数据收集和标准化
[信息待补充]
源语言生产者
[信息待补充]
注释
注释过程
[信息待补充]
注释者
[信息待补充]
个人和敏感信息
[信息待补充]
使用数据的考虑
数据集的社会影响
[信息待补充]
讨论偏见
[信息待补充]
其他已知限制
[信息待补充]
附加信息
数据集管理者
[信息待补充]
许可信息
商业许可:https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
引用信息
[信息待补充]
贡献
[信息待补充]
搜集汇总
数据集介绍

构建方式
在婴幼儿语音识别研究领域,高质量数据的采集是模型训练的基础。该数据集通过移动设备采集了20名0至3岁婴幼儿的笑声语音,每位婴幼儿提供了多段语音段落,旨在为智能家居场景下的儿童笑声检测提供数据支持。数据采集过程注重自然情境下的声音捕捉,确保了语音样本的真实性与多样性,为相关研究提供了宝贵的原始素材。
特点
该数据集聚焦于婴幼儿笑声语音,覆盖了0至3岁年龄段的语音特征,具有明确的年龄分布特性。语音样本由移动设备录制,反映了日常环境中的声音质量,适用于实际应用场景的模型训练。数据以商业许可形式提供,支持自动语音识别和说话人识别等任务,为智能家居项目的儿童声音检测提供了专门化的数据资源。
使用方法
在语音处理应用中,该数据集可用于训练自动语音识别模型,特别是在婴幼儿笑声检测任务中。研究人员可通过HuggingFace平台访问样本数据,完整数据集需通过指定链接获取商业许可后使用。建议在预处理阶段考虑环境噪声的影响,并依据年龄分组进行模型优化,以提升在智能家居系统中的实际性能。
背景与挑战
背景概述
在婴幼儿早期发育与智能家居交互技术融合的研究背景下,Nexdata/Infant_Laugh_Speech_Data_by_Mobile_Phone数据集应运而生。该数据集由Nexdata机构创建,专注于采集0至3岁婴幼儿的笑声语音数据,旨在为智能家居场景中的儿童笑声检测提供关键数据支持。其核心研究问题聚焦于如何利用移动设备捕获的非结构化婴幼儿音频,推动自动语音识别与说话人识别技术在低龄群体中的应用,从而深化对婴幼儿情感表达与语音发育模式的理解,并为相关人机交互系统的优化奠定实证基础。
当前挑战
该数据集致力于解决婴幼儿笑声检测这一特定领域问题,其挑战在于婴幼儿笑声具有高度的个体差异性与发育阶段性特征,声学模式多变且易与环境噪声混淆,对模型的泛化能力与鲁棒性提出严峻考验。在构建过程中,数据采集面临诸多困难:婴幼儿音频的获取需严格遵循伦理规范与隐私保护,样本规模受限;同时,移动设备录制的音频常包含背景干扰,数据清洗与标注需耗费大量人力以确保质量,而年龄跨度带来的声学变异进一步增加了数据标准化与注释一致性的难度。
常用场景
经典使用场景
在婴幼儿语音识别与情感计算领域,该数据集为研究者提供了宝贵的婴幼儿笑声语音样本。通过收录0至3岁婴幼儿的笑声数据,它支持构建针对婴幼儿笑声的自动检测模型,尤其在智能家居环境中,能够辅助识别婴幼儿的情绪状态,为早期儿童发展研究奠定数据基础。
实际应用
在实际应用中,该数据集可集成于智能家居系统,用于实时监测婴幼儿的情绪变化,例如通过笑声检测辅助家长或看护者了解儿童状态。同时,在儿童教育或医疗辅助设备中,它也能为情感交互应用提供数据支持,提升智能化服务的针对性与可靠性。
衍生相关工作
基于该数据集,相关研究可衍生出针对婴幼儿笑声的自动分类与识别模型,例如在语音情感识别领域构建轻量级检测系统。此外,它还可能激发跨领域工作,如结合发育心理学分析笑声模式与儿童健康关联,或优化多模态交互系统中的儿童语音处理模块。
以上内容由遇见数据集搜集并总结生成



