nilc-nlp/catna-prosodic-concatenated
收藏Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/nilc-nlp/catna-prosodic-concatenated
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: File
dtype: large_string
- name: Speaker
dtype: large_string
- name: Number_Concatenated
dtype: int64
- name: Index_Concatenated
dtype: large_string
- name: Start
dtype: float64
- name: End
dtype: float64
- name: Duration
dtype: float64
- name: Text
dtype: large_string
- name: audio
dtype: audio
splits:
- name: train
num_bytes: 15129651394
num_examples: 10656
download_size: 13338816340
dataset_size: 15129651394
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
CATNA:
Entendível / Nível de Ruído
SP_D2_008_parte_2: sim / médio \
SP_D2_010_parte_1: maioria / médio\
SP_D2_010_parte_3: maioria / médio\
SP_D2_012_1: maioria / muito\
SP_D2_023_parte_1: sim / pouco (de fundo)\
SP_D2_055_0: maioria (estourado) / não\
SP_D2_078: sim / pouco\
SP_D2_095: sim / não\
SP_D2_109: sim / não\
SP_DID_001: sim / pouco\
SP_DID_002: sim / pouco\
SP_DID_009: sim / médio\
SP_DID_011: sim / pouco\
SP_DID_013: sim / médio\
SP_DID_016: maioria / médio\
SP_DID_017: sim / pouco\
SP_DID_030: sim / pouco\
SP_DID_043: sim / pouco\
SP_DID_044: sim / médio\
SP_DID_053: sim / não\
SP_DID_068: sim / não\
SP_DID_070: sim / pouco\
SP_DID_089: sim / não\
SP_DID_090: sim / pouco\
SP_DID_111: maioria / médio\
SP_DID_114: sim / pouco\
SP_DID_121: sim / não\
Marcações do CATNA que não existem no CM:
()\
( )\
(\
)\
:\
((risos))\
uhn\
ahn\
/\
...\
\[\
\]\
((risos de L2))\
((risos de doc 1))\
((risos de L1))\
((risos de doc 2))\
((riso))\
((incompreensível))\
((tosse))\
((tossiu))\
((rindo))\
((negativamente))\
((pigarro))\
((clique))\
((Doc1 dá uma risada de fundo))\
((ruído))\
((riu))\
((imita barulho de carro))
提供机构:
nilc-nlp



