mmtg/train-inv
收藏Hugging Face2024-06-29 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mmtg/train-inv
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含患者ID、转录文本、音频数据和类别四个主要特征。音频数据的采样率为16000Hz。数据集分为训练集、验证集和测试集,分别包含438、55和55个样本。数据集的下载大小为2459698629字节,总大小为3390546535字节。
The dataset contains four main features: patient_id, transcript, audio, and category. The audio data has a sampling rate of 16000Hz. The dataset is divided into three parts: train, valid, and test, containing 438, 55, and 55 samples respectively. The download size of the dataset is 2459698629 bytes, and the total size is 3390546535 bytes.
提供机构:
mmtg
原始信息汇总
数据集概述
数据集信息
特征
- patient_id: 类型为字符串。
- transcript: 类型为字符串。
- audio: 类型为音频,采样率为16000。
- category: 类型为64位整数。
数据分割
- train: 包含438个样本,大小为2711303869.0字节。
- valid: 包含55个样本,大小为353153500.0字节。
- test: 包含55个样本,大小为326089166.0字节。
数据集大小
- 下载大小: 2459698629字节。
- 总大小: 3390546535.0字节。
配置
- default:
- train: 数据路径为
data/train-*。 - valid: 数据路径为
data/valid-*。 - test: 数据路径为
data/test-*。
- train: 数据路径为



