five

CLAPv2/vggsound_formatted_batch_7

收藏
Hugging Face2024-09-19 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/CLAPv2/vggsound_formatted_batch_7
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: __key__ dtype: string - name: __url__ dtype: string - name: flac dtype: audio - name: json struct: - name: original_data struct: - name: description dtype: string - name: filename dtype: string - name: label dtype: string - name: license dtype: string - name: split dtype: string - name: start dtype: int64 - name: title dtype: string - name: url dtype: string - name: tag sequence: string - name: text sequence: string - name: index dtype: string - name: datasetname dtype: string - name: audio struct: - name: array sequence: float64 - name: path dtype: string - name: sampling_rate dtype: int64 - name: text dtype: string - name: raw_text sequence: sequence: string - name: audio_len dtype: int64 splits: - name: train num_bytes: 47911927814.0 num_examples: 10000 download_size: 18684377816 dataset_size: 47911927814.0 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征列表: - 名称:__key__,数据类型:字符串(string) - 名称:__url__,数据类型:字符串(string) - 名称:FLAC,数据类型:音频(audio) - 名称:JSON,为结构体类型,其包含子字段如下: - 子字段original_data,为结构体类型,包含以下子字段: - description(描述):字符串类型 - filename(文件名):字符串类型 - label(标签):字符串类型 - license(许可协议):字符串类型 - split(数据集划分):字符串类型 - start(起始位置):64位整型(int64) - title(标题):字符串类型 - url(链接):字符串类型 - 子字段tag:字符串序列(sequence<string>) - 子字段text:字符串序列(sequence<string>) - 名称:index,数据类型:字符串(string) - 名称:datasetname,数据类型:字符串(string) - 名称:audio,为结构体类型,包含以下子字段: - array:64位浮点型序列(sequence<float64>) - path:字符串类型 - sampling_rate(采样率):64位整型(int64) - 名称:text,数据类型:字符串(string) - 名称:raw_text:字符串序列的序列(sequence<sequence<string>>) - 名称:audio_len,数据类型:64位整型(int64) 数据集划分: - 划分名称:train(训练集),占用字节数:47911927814.0,样本总数:10000 下载总大小:18684377816字节 数据集总大小:47911927814.0字节 配置信息: - 配置名称:default(默认配置),数据文件: - 针对训练集划分,数据文件路径为 data/train-*
提供机构:
CLAPv2
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作