ehusaint/dataset-lisan-tiny
收藏Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ehusaint/dataset-lisan-tiny
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、客户端ID和转录文本三个特征。数据集分为训练集和测试集,训练集包含3个示例,占用516365字节;测试集包含1个示例,占用230885字节。总下载大小为720756字节,数据集总大小为747250字节。数据文件路径分别为data/train-*和data/test-*。
该数据集包含音频、客户端ID和转录文本三个特征。数据集分为训练集和测试集,训练集包含3个示例,占用516365字节;测试集包含1个示例,占用230885字节。总下载大小为720756字节,数据集总大小为747250字节。数据文件路径分别为data/train-*和data/test-*。
提供机构:
ehusaint
原始信息汇总
数据集概述
特征信息
- 音频
- 名称: audio
- 数据类型: audio
- 客户端ID
- 名称: client_id
- 数据类型: int64
- 转录文本
- 名称: transcription
- 数据类型: string
数据分割
- 训练集
- 名称: train
- 字节数: 516365.0
- 样本数: 3
- 测试集
- 名称: test
- 字节数: 230885.0
- 样本数: 1
数据集大小
- 下载大小: 720756
- 数据集大小: 747250.0
配置信息
- 默认配置
- 数据文件
- 训练集
- 分割: train
- 路径: data/train-*
- 测试集
- 分割: test
- 路径: data/test-*
- 训练集
- 数据文件



