five

Codec-SUPERB/fsd50k_synth

收藏
Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/fsd50k_synth
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: audio dtype: audio: sampling_rate: 48000 - name: id dtype: string splits: - name: original num_bytes: 13195529214.0 num_examples: 14400 - name: academicodec_hifi_16k_320d num_bytes: 4394951316.8 num_examples: 14400 - name: academicodec_hifi_16k_320d_large_uni num_bytes: 4394951316.8 num_examples: 14400 - name: academicodec_hifi_24k_320d num_bytes: 6594002836.8 num_examples: 14400 - name: audiodec_24k_320d num_bytes: 6602175476.8 num_examples: 14400 - name: dac_16k num_bytes: 4399074434.8 num_examples: 14400 - name: dac_24k num_bytes: 6598190560.8 num_examples: 14400 - name: dac_44k num_bytes: 12123481360.8 num_examples: 14400 - name: encodec_24k_12bps num_bytes: 6598190560.8 num_examples: 14400 - name: encodec_24k_1_5bps num_bytes: 6598190560.8 num_examples: 14400 - name: encodec_24k_24bps num_bytes: 6598190560.8 num_examples: 14400 - name: encodec_24k_3bps num_bytes: 6598190560.8 num_examples: 14400 - name: encodec_24k_6bps num_bytes: 6598190560.8 num_examples: 14400 - name: funcodec_en_libritts_16k_gr1nq32ds320 num_bytes: 4398060802.8 num_examples: 14400 - name: funcodec_en_libritts_16k_gr8nq32ds320 num_bytes: 4398060802.8 num_examples: 14400 - name: funcodec_en_libritts_16k_nq32ds320 num_bytes: 4399074434.8 num_examples: 14400 - name: funcodec_en_libritts_16k_nq32ds640 num_bytes: 4399074434.8 num_examples: 14400 - name: funcodec_zh_en_16k_nq32ds320 num_bytes: 4399074434.8 num_examples: 14400 - name: funcodec_zh_en_16k_nq32ds640 num_bytes: 4399074434.8 num_examples: 14400 - name: speech_tokenizer_16k num_bytes: 4403182996.8 num_examples: 14400 download_size: 111970844494 dataset_size: 122088911663.20004 configs: - config_name: default data_files: - split: original path: data/original-* - split: academicodec_hifi_16k_320d path: data/academicodec_hifi_16k_320d-* - split: academicodec_hifi_16k_320d_large_uni path: data/academicodec_hifi_16k_320d_large_uni-* - split: academicodec_hifi_24k_320d path: data/academicodec_hifi_24k_320d-* - split: audiodec_24k_320d path: data/audiodec_24k_320d-* - split: dac_16k path: data/dac_16k-* - split: dac_24k path: data/dac_24k-* - split: dac_44k path: data/dac_44k-* - split: encodec_24k_12bps path: data/encodec_24k_12bps-* - split: encodec_24k_1_5bps path: data/encodec_24k_1_5bps-* - split: encodec_24k_24bps path: data/encodec_24k_24bps-* - split: encodec_24k_3bps path: data/encodec_24k_3bps-* - split: encodec_24k_6bps path: data/encodec_24k_6bps-* - split: funcodec_en_libritts_16k_gr1nq32ds320 path: data/funcodec_en_libritts_16k_gr1nq32ds320-* - split: funcodec_en_libritts_16k_gr8nq32ds320 path: data/funcodec_en_libritts_16k_gr8nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds320 path: data/funcodec_en_libritts_16k_nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds640 path: data/funcodec_en_libritts_16k_nq32ds640-* - split: funcodec_zh_en_16k_nq32ds320 path: data/funcodec_zh_en_16k_nq32ds320-* - split: funcodec_zh_en_16k_nq32ds640 path: data/funcodec_zh_en_16k_nq32ds640-* - split: speech_tokenizer_16k path: data/speech_tokenizer_16k-* ---

dataset_info: 数据集信息 features: 特征字段 - name: 音频(audio) dtype: 数据类型 audio: 音频格式 采样率(sampling_rate): 48000 - name: 编号(id) dtype: 字符串(string) splits: 数据集划分 - name: 原始数据集(original) num_bytes: 13195529214.0 num_examples: 14400 - name: 学术高保真编解码器(academicodec_hifi_16k_320d) num_bytes: 4394951316.8 num_examples: 14400 - name: 学术高保真统一编解码器(academicodec_hifi_16k_320d_large_uni) num_bytes: 4394951316.8 num_examples: 14400 - name: 学术高保真24k编解码器(academicodec_hifi_24k_320d) num_bytes: 6594002836.8 num_examples: 14400 - name: 音频编解码器24k_320d(audiodec_24k_320d) num_bytes: 6602175476.8 num_examples: 14400 - name: DAC 16k编解码器(dac_16k) num_bytes: 4399074434.8 num_examples: 14400 - name: DAC 24k编解码器(dac_24k) num_bytes: 6598190560.8 num_examples: 14400 - name: DAC 44k编解码器(dac_44k) num_bytes: 12123481360.8 num_examples: 14400 - name: EnCodec 24k 12bps编解码器(encodec_24k_12bps) num_bytes: 6598190560.8 num_examples: 14400 - name: EnCodec 24k 1.5bps编解码器(encodec_24k_1_5bps) num_bytes: 6598190560.8 num_examples: 14400 - name: EnCodec 24k 24bps编解码器(encodec_24k_24bps) num_bytes: 6598190560.8 num_examples: 14400 - name: EnCodec 24k 3bps编解码器(encodec_24k_3bps) num_bytes: 6598190560.8 num_examples: 14400 - name: EnCodec 24k 6bps编解码器(encodec_24k_6bps) num_bytes: 6598190560.8 num_examples: 14400 - name: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_gr1nq32ds320) num_bytes: 4398060802.8 num_examples: 14400 - name: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_gr8nq32ds320) num_bytes: 4398060802.8 num_examples: 14400 - name: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_nq32ds320) num_bytes: 4399074434.8 num_examples: 14400 - name: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_nq32ds640) num_bytes: 4399074434.8 num_examples: 14400 - name: FunCodec 中英双语16k编解码器(funcodec_zh_en_16k_nq32ds320) num_bytes: 4399074434.8 num_examples: 14400 - name: FunCodec 中英双语16k编解码器(funcodec_zh_en_16k_nq32ds640) num_bytes: 4399074434.8 num_examples: 14400 - name: 语音分词器(speech_tokenizer_16k) num_bytes: 4403182996.8 num_examples: 14400 download_size: 111970844494 dataset_size: 122088911663.20004 configs: 数据集配置 - config_name: 默认配置(default) data_files: 数据文件列表 - split: 原始数据集(original) path: data/original-* - split: 学术高保真编解码器(academicodec_hifi_16k_320d) path: data/academicodec_hifi_16k_320d-* - split: 学术高保真统一编解码器(academicodec_hifi_16k_320d_large_uni) path: data/academicodec_hifi_16k_320d_large_uni-* - split: 学术高保真24k编解码器(academicodec_hifi_24k_320d) path: data/academicodec_hifi_24k_320d-* - split: 音频编解码器24k_320d(audiodec_24k_320d) path: data/audiodec_24k_320d-* - split: DAC 16k编解码器(dac_16k) path: data/dac_16k-* - split: DAC 24k编解码器(dac_24k) path: data/dac_24k-* - split: DAC 44k编解码器(dac_44k) path: data/dac_44k-* - split: EnCodec 24k 12bps编解码器(encodec_24k_12bps) path: data/encodec_24k_12bps-* - split: EnCodec 24k 1.5bps编解码器(encodec_24k_1_5bps) path: data/encodec_24k_1_5bps-* - split: EnCodec 24k 24bps编解码器(encodec_24k_24bps) path: data/encodec_24k_24bps-* - split: EnCodec 24k 3bps编解码器(encodec_24k_3bps) path: data/encodec_24k_3bps-* - split: EnCodec 24k 6bps编解码器(encodec_24k_6bps) path: data/encodec_24k_6bps-* - split: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_gr1nq32ds320) path: data/funcodec_en_libritts_16k_gr1nq32ds320-* - split: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_gr8nq32ds320) path: data/funcodec_en_libritts_16k_gr8nq32ds320-* - split: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_nq32ds320) path: data/funcodec_en_libritts_16k_nq32ds320-* - split: FunCodec 英语言语库16k编解码器(funcodec_en_libritts_16k_nq32ds640) path: data/funcodec_en_libritts_16k_nq32ds640-* - split: FunCodec 中英双语16k编解码器(funcodec_zh_en_16k_nq32ds320) path: data/funcodec_zh_en_16k_nq32ds320-* - split: FunCodec 中英双语16k编解码器(funcodec_zh_en_16k_nq32ds640) path: data/funcodec_zh_en_16k_nq32ds640-* - split: 语音分词器(speech_tokenizer_16k) path: data/speech_tokenizer_16k-*
提供机构:
Codec-SUPERB
原始信息汇总

数据集概述

特征

  • 音频
    • 采样率: 48000
  • ID
    • 数据类型: 字符串

数据分割

  • original
    • 字节数: 13195529214.0
    • 样本数: 14400
  • academicodec_hifi_16k_320d
    • 字节数: 4394951316.8
    • 样本数: 14400
  • academicodec_hifi_16k_320d_large_uni
    • 字节数: 4394951316.8
    • 样本数: 14400
  • academicodec_hifi_24k_320d
    • 字节数: 6594002836.8
    • 样本数: 14400
  • audiodec_24k_320d
    • 字节数: 6602175476.8
    • 样本数: 14400
  • dac_16k
    • 字节数: 4399074434.8
    • 样本数: 14400
  • dac_24k
    • 字节数: 6598190560.8
    • 样本数: 14400
  • dac_44k
    • 字节数: 12123481360.8
    • 样本数: 14400
  • encodec_24k_12bps
    • 字节数: 6598190560.8
    • 样本数: 14400
  • encodec_24k_1_5bps
    • 字节数: 6598190560.8
    • 样本数: 14400
  • encodec_24k_24bps
    • 字节数: 6598190560.8
    • 样本数: 14400
  • encodec_24k_3bps
    • 字节数: 6598190560.8
    • 样本数: 14400
  • encodec_24k_6bps
    • 字节数: 6598190560.8
    • 样本数: 14400
  • funcodec_en_libritts_16k_gr1nq32ds320
    • 字节数: 4398060802.8
    • 样本数: 14400
  • funcodec_en_libritts_16k_gr8nq32ds320
    • 字节数: 4398060802.8
    • 样本数: 14400
  • funcodec_en_libritts_16k_nq32ds320
    • 字节数: 4399074434.8
    • 样本数: 14400
  • funcodec_en_libritts_16k_nq32ds640
    • 字节数: 4399074434.8
    • 样本数: 14400
  • funcodec_zh_en_16k_nq32ds320
    • 字节数: 4399074434.8
    • 样本数: 14400
  • funcodec_zh_en_16k_nq32ds640
    • 字节数: 4399074434.8
    • 样本数: 14400
  • speech_tokenizer_16k
    • 字节数: 4403182996.8
    • 样本数: 14400

数据集大小

  • 下载大小: 111970844494
  • 数据集大小: 122088911663.20004

配置

  • 默认配置
    • 数据文件路径:
      • original: data/original-*
      • academicodec_hifi_16k_320d: data/academicodec_hifi_16k_320d-*
      • academicodec_hifi_16k_320d_large_uni: data/academicodec_hifi_16k_320d_large_uni-*
      • academicodec_hifi_24k_320d: data/academicodec_hifi_24k_320d-*
      • audiodec_24k_320d: data/audiodec_24k_320d-*
      • dac_16k: data/dac_16k-*
      • dac_24k: data/dac_24k-*
      • dac_44k: data/dac_44k-*
      • encodec_24k_12bps: data/encodec_24k_12bps-*
      • encodec_24k_1_5bps: data/encodec_24k_1_5bps-*
      • encodec_24k_24bps: data/encodec_24k_24bps-*
      • encodec_24k_3bps: data/encodec_24k_3bps-*
      • encodec_24k_6bps: data/encodec_24k_6bps-*
      • funcodec_en_libritts_16k_gr1nq32ds320: data/funcodec_en_libritts_16k_gr1nq32ds320-*
      • funcodec_en_libritts_16k_gr8nq32ds320: data/funcodec_en_libritts_16k_gr8nq32ds320-*
      • funcodec_en_libritts_16k_nq32ds320: data/funcodec_en_libritts_16k_nq32ds320-*
      • funcodec_en_libritts_16k_nq32ds640: data/funcodec_en_libritts_16k_nq32ds640-*
      • funcodec_zh_en_16k_nq32ds320: data/funcodec_zh_en_16k_nq32ds320-*
      • funcodec_zh_en_16k_nq32ds640: data/funcodec_zh_en_16k_nq32ds640-*
      • speech_tokenizer_16k: data/speech_tokenizer_16k-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作