uclgroup8/iemocap-embeddings
收藏Hugging Face2024-03-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/uclgroup8/iemocap-embeddings
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: emotion
dtype: string
- name: to_translate
dtype: string
- name: audio
struct:
- name: array
sequence: float64
- name: path
dtype: string
- name: sampling_rate
dtype: int64
- name: audio_embedding
sequence:
sequence: float32
- name: labels
dtype: int64
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: text_embedding
sequence:
sequence: float32
splits:
- name: train
num_bytes: 7236113276
num_examples: 5501
- name: test
num_bytes: 903332659
num_examples: 688
- name: val
num_bytes: 892340031
num_examples: 688
download_size: 6063760914
dataset_size: 9031785966
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: val
path: data/val-*
---
数据集信息:
特征字段:
- 字段名:emotion,数据类型:字符串
- 字段名:to_translate,数据类型:字符串
- 字段名:audio,为结构体类型,包含以下子字段:
- 子字段array(数组):float64类型序列
- 子字段path:字符串类型
- 子字段采样率(sampling_rate):int64类型
- 字段名:audio_embedding(音频嵌入):float32类型的二维序列
- 字段名:labels,数据类型:int64
- 字段名:input_ids(输入标识序列):int32类型序列
- 字段名:attention_mask(注意力掩码):int8类型序列
- 字段名:text_embedding(文本嵌入):float32类型的二维序列
数据集划分:
- 划分名称:train(训练集),字节占用量:7236113276,样本总数:5501
- 划分名称:test(测试集),字节占用量:903332659,样本总数:688
- 划分名称:val(验证集),字节占用量:892340031,样本总数:688
下载总大小:6063760914 字节
数据集总占用大小:9031785966 字节
配置项:
- 配置名称:default(默认配置),数据文件映射关系如下:
- 训练集:data/train-*
- 测试集:data/test-*
- 验证集:data/val-*
提供机构:
uclgroup8
原始信息汇总
数据集概述
数据集特征
- emotion
- 数据类型:字符串
- to_translate
- 数据类型:字符串
- audio
- 结构:
- array
- 序列类型:float64
- path
- 数据类型:字符串
- sampling_rate
- 数据类型:int64
- array
- 结构:
- audio_embedding
- 序列结构:
- 序列类型:float32
- 序列结构:
- labels
- 数据类型:int64
- input_ids
- 序列类型:int32
- attention_mask
- 序列类型:int8
- text_embedding
- 序列结构:
- 序列类型:float32
- 序列结构:
数据集分割
- 训练集 (train)
- 数据量:7236113276 字节
- 示例数量:5501
- 测试集 (test)
- 数据量:903332659 字节
- 示例数量:688
- 验证集 (val)
- 数据量:892340031 字节
- 示例数量:688
数据集大小
- 下载大小:6063760914 字节
- 数据集总大小:9031785966 字节
配置文件
- 默认配置 (default)
- 数据文件路径:
- 训练集:
data/train-* - 测试集:
data/test-* - 验证集:
data/val-*
- 训练集:
- 数据文件路径:



