Nexdata/Italian_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/Italian_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由3,109名意大利母语者录制,涵盖了广泛的类别,如通用、交互式、车内命令、家庭命令等。文本由语言专家设计,并经过人工校对,确保高准确性。数据集支持自动语音识别和音频说话人识别任务。语言为意大利语。
---
YAML 标签:
- 复制粘贴由标签工具获取的标签:https://github.com/huggingface/datasets-tagging
---
# 数据集卡片:Nexdata/移动端录制意大利语语音数据集
## 目录
- [目录](#table-of-contents)
- [数据集描述](#dataset-description)
- [数据集摘要](#dataset-summary)
- [支持任务与排行榜](#supported-tasks-and-leaderboards)
- [语言](#languages)
- [数据集结构](#dataset-structure)
- [数据实例](#data-instances)
- [数据字段](#data-fields)
- [数据划分](#data-splits)
- [数据集构建](#dataset-creation)
- [数据集构建依据](#curation-rationale)
- [源数据](#source-data)
- [标注信息](#annotations)
- [个人与敏感信息](#personal-and-sensitive-information)
- [数据集使用注意事项](#considerations-for-using-the-data)
- [数据集的社会影响](#social-impact-of-dataset)
- [偏见讨论](#discussion-of-biases)
- [其他已知局限性](#other-known-limitations)
- [附加信息](#additional-information)
- [数据集采集者](#dataset-curators)
- [许可信息](#licensing-information)
- [引用信息](#citation-information)
- [贡献](#contributions)
## 数据集描述
- **主页**:https://www.nexdata.ai/datasets/948?source=Huggingface
- **代码仓库**:
- **论文**:
- **排行榜**:
- **联系方式**:
### 数据集摘要
本数据集由3109名带有纯正意大利口音的意大利母语者录制。录制内容涵盖通用场景、交互场景、车载指令、家居指令等多个类别。录制文本由语言专家设计,并经过人工校对,准确率极高。录制设备适配主流安卓(Android)与苹果(Apple)系统手机。
如需了解更多细节,请访问链接:https://www.nexdata.ai/datasets/948?source=Huggingface
### 支持任务与排行榜
自动语音识别(Automatic Speech Recognition, ASR)、音频说话人识别:本数据集可用于训练自动语音识别模型。
### 语言
意大利语
## 数据集结构
### 数据实例
[需补充更多信息]
### 数据字段
[需补充更多信息]
### 数据划分
[需补充更多信息]
## 数据集构建
### 数据集构建依据
[需补充更多信息]
### 源数据
#### 初始数据采集与归一化
[需补充更多信息]
#### 源语言提供者是谁?
[需补充更多信息]
### 标注信息
#### 标注流程
[需补充更多信息]
#### 标注者是谁?
[需补充更多信息]
### 个人与敏感信息
[需补充更多信息]
## 数据集使用注意事项
### 数据集的社会影响
[需补充更多信息]
### 偏见讨论
[需补充更多信息]
### 其他已知局限性
[需补充更多信息]
## 附加信息
### 数据集采集者
[需补充更多信息]
### 许可信息
商业许可:https://drive.google.com/file/d/1saDCPm74D4UWfBL17VbkTsZLGfpOQj1J/view?usp=sharing
### 引用信息
[需补充更多信息]
### 贡献
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
Nexdata/Italian_Speech_Data_by_Mobile_Phone
数据集描述
数据集摘要
该数据集由3,109名具有纯正意大利口音的意大利母语者录制,内容涵盖广泛,包括通用目的、交互式、车载命令、家庭命令等。录音文本由语言专家设计,并经过人工校对,确保高准确性。适用于主流的Android和Apple系统手机。
支持的任务和排行榜
- 自动语音识别(ASR)
- 音频说话人识别
语言
意大利语
数据集结构
数据实例
[信息待补充]
数据字段
[信息待补充]
数据分割
[信息待补充]
数据集创建
数据收集和规范化
[信息待补充]
源语言生产者
[信息待补充]
注释过程
[信息待补充]
注释者
[信息待补充]
个人和敏感信息
[信息待补充]
使用数据集的考虑因素
数据集的社会影响
[信息待补充]
数据集的偏见讨论
[信息待补充]
其他已知限制
[信息待补充]
附加信息
数据集管理员
[信息待补充]
许可证信息
商业许可证:链接
引用信息
[信息待补充]



