thomasavare/waste-classification-audio-helsinki
收藏Hugging Face2024-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thomasavare/waste-classification-audio-helsinki
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为waste-classification-audio,支持英语和意大利语。数据集包含音频、说话者、转录、翻译、类别和类别索引等特征。训练集包含500个样本,总大小为380069293字节,下载大小为287632439字节。数据集的英语到意大利语翻译是使用Helsinki-NLP的翻译模型完成的。数据集采用cc-by-nc-nd-4.0许可证。
该数据集名为waste-classification-audio,支持英语和意大利语。数据集包含音频、说话者、转录、翻译、类别和类别索引等特征。训练集包含500个样本,总大小为380069293字节,下载大小为287632439字节。数据集的英语到意大利语翻译是使用Helsinki-NLP的翻译模型完成的。数据集采用cc-by-nc-nd-4.0许可证。
提供机构:
thomasavare
原始信息汇总
数据集概述
数据集名称
- waste-classification-audio
语言
- 英语 (en)
- 意大利语 (it)
配置
- 默认配置 (config_name: default)
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集特征
- audio: 音频数据
- speaker: 说话人信息,字符串类型
- transcription: 转录文本,字符串类型
- translation: 翻译文本,字符串类型
- Class: 分类标签,字符串类型
- Class_index: 分类索引,浮点数类型
数据集划分
- 训练集 (train)
- 字节数: 380069293
- 样本数: 500
数据集大小
- 下载大小: 287632439
- 数据集大小: 380069293
许可证
- cc-by-nc-nd-4.0



