thomasavare/waste-classification-audio-helsinki

Name: thomasavare/waste-classification-audio-helsinki
Creator: thomasavare
Published: 2024-04-25 17:44:59
License: 暂无描述

Hugging Face2024-04-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/thomasavare/waste-classification-audio-helsinki

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为waste-classification-audio，支持英语和意大利语。数据集包含音频、说话者、转录、翻译、类别和类别索引等特征。训练集包含500个样本，总大小为380069293字节，下载大小为287632439字节。数据集的英语到意大利语翻译是使用Helsinki-NLP的翻译模型完成的。数据集采用cc-by-nc-nd-4.0许可证。

提供机构：

thomasavare

原始信息汇总

数据集概述

数据集名称

waste-classification-audio

语言

英语 (en)
意大利语 (it)

配置

默认配置 (config_name: default)
- 数据文件路径: data/train-*

数据集特征

audio: 音频数据
speaker: 说话人信息，字符串类型
transcription: 转录文本，字符串类型
translation: 翻译文本，字符串类型
Class: 分类标签，字符串类型
Class_index: 分类索引，浮点数类型

数据集划分

训练集 (train)
- 字节数: 380069293
- 样本数: 500

数据集大小

下载大小: 287632439
数据集大小: 380069293

许可证

cc-by-nc-nd-4.0

5,000+

优质数据集

54 个

任务类型

进入经典数据集