0-hero/lj_speech_with_spectogram
收藏Hugging Face2024-04-05 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/0-hero/lj_speech_with_spectogram
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于将音频波形转换为ASCII艺术,并通过微调Mistral模型来从ASCII艺术中预测文本。数据集包含音频、文本、归一化文本和频谱图等特征,并提供了训练集的分割信息。实验结果显示,尽管进行了微调,但模型的性能并未显著提升。
该数据集用于将音频波形转换为ASCII艺术,并通过微调Mistral模型来从ASCII艺术中预测文本。数据集包含音频、文本、归一化文本和频谱图等特征,并提供了训练集的分割信息。实验结果显示,尽管进行了微调,但模型的性能并未显著提升。
提供机构:
0-hero
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- audio: 数据类型为音频,采样率为22050。
- file: 数据类型为字符串。
- text: 数据类型为字符串。
- normalized_text: 数据类型为字符串。
- spectogram: 数据类型为字符串。
数据集划分
- train: 训练集,包含13100个样本,总大小为3952752554.0字节。
数据集大小
- 下载大小: 3818657682字节。
- 数据集总大小: 3952752554.0字节。
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
相关数据集
- lj_speech: 用于将音频波形转换为ASCII艺术的数据集。
- 0-hero/lj_speech_with_spectogram_conversations: 包含训练和测试分割的ShareGPT风格微调数据集。
- 0-hero/lj_speech_with_spectogram: 包含ASCII艺术的原始数据集。



