five

Nexdata/58_Hours_European_Portuguese_Child_Spontaneous_Speech_Data_Nexdata

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/58_Hours_European_Portuguese_Child_Spontaneous_Speech_Data_Nexdata
下载链接
链接失效反馈
官方服务:
资源简介:
葡萄牙(葡萄牙)儿童真实世界随意对话和独白语音数据集,涵盖了自媒体、对话、直播、讲座、综艺节目等多个通用领域,反映了真实世界的互动。数据集包括文本内容、说话者ID、性别、年龄、口音等属性的转录。数据集收集自广泛且多样化的说话者(12岁及以下的儿童),地理分布广泛,旨在提升模型在真实和复杂任务中的表现。数据集的质量经过多家AI公司的测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。

葡萄牙(葡萄牙)儿童真实世界随意对话和独白语音数据集,涵盖了自媒体、对话、直播、讲座、综艺节目等多个通用领域,反映了真实世界的互动。数据集包括文本内容、说话者ID、性别、年龄、口音等属性的转录。数据集收集自广泛且多样化的说话者(12岁及以下的儿童),地理分布广泛,旨在提升模型在真实和复杂任务中的表现。数据集的质量经过多家AI公司的测试,并严格遵守数据保护法规和隐私标准,确保在数据收集、存储和使用过程中维护用户隐私和合法权益,符合GDPR、CCPA、PIPL等法规。
提供机构:
Nexdata
原始信息汇总

数据集概述

基本信息

  • 许可证: CC-BY-NC-ND-4.0
  • 格式: 16kHz, 16 bit, wav, mono channel
  • 年龄范围: 12岁及以下儿童
  • 国家: 葡萄牙(PT)
  • 语言: 葡萄牙语
  • 语言区域代码: pt-PT

内容描述

  • 内容类别: 包括访谈、自媒体、综艺节目等
  • 录音环境: 低背景噪音
  • 数据集特点: 包含转录文本、时间戳、说话人ID、性别、噪音等标注信息
  • 准确性: 单词准确率(WAR) 98%

数据集详情

  • 描述: 该数据集包含葡萄牙儿童在现实生活中的随意对话和独白,覆盖自媒体、对话、直播、讲座、综艺节目等多个通用领域,反映真实世界互动。数据集由广泛且多样化的12岁及以下儿童发音者收集,地理上增强了模型在真实和复杂任务中的性能。
  • 质量保证: 经过多家AI公司的质量测试
  • 合规性: 严格遵守数据保护法规和隐私标准,确保用户隐私和法律权利在数据收集、存储和使用过程中的维护,符合GDPR、CCPA、PIPL标准。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作