linhqyy/base_aug_syn_60_spkn_55
收藏Hugging Face2023-09-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/linhqyy/base_aug_syn_60_spkn_55
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: sentence
dtype: string
- name: intent
dtype: string
- name: sentence_annotation
dtype: string
- name: entities
list:
- name: type
dtype: string
- name: filler
dtype: string
- name: file
dtype: string
- name: audio
struct:
- name: array
sequence: float64
- name: path
dtype: string
- name: sampling_rate
dtype: int64
- name: origin_transcription
dtype: string
- name: sentence_norm
dtype: string
- name: w2v2_baseline_transcription
dtype: string
- name: w2v2_baseline_norm
dtype: string
splits:
- name: train
num_bytes: 390350279
num_examples: 748
download_size: 93073032
dataset_size: 390350279
---
# Dataset Card for "base_aug_syn_60_spkn_55"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
linhqyy
原始信息汇总
数据集信息
特征
- id: 数据类型为字符串。
- sentence: 数据类型为字符串。
- intent: 数据类型为字符串。
- sentence_annotation: 数据类型为字符串。
- entities: 列表类型,包含以下子特征:
- type: 数据类型为字符串。
- filler: 数据类型为字符串。
- file: 数据类型为字符串。
- audio: 结构类型,包含以下子特征:
- array: 序列类型,数据类型为float64。
- path: 数据类型为字符串。
- sampling_rate: 数据类型为int64。
- origin_transcription: 数据类型为字符串。
- sentence_norm: 数据类型为字符串。
- w2v2_baseline_transcription: 数据类型为字符串。
- w2v2_baseline_norm: 数据类型为字符串。
数据分割
- train: 包含748个样本,总字节数为390350279。
数据集大小
- 下载大小: 93073032字节。
- 数据集大小: 390350279字节。



