five

joujiboi/japanese-anime-speech-v2

收藏
Hugging Face2024-07-12 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/joujiboi/japanese-anime-speech-v2
下载链接
链接失效反馈
官方服务:
资源简介:
Japanese Anime Speech Dataset V2是一个音频-文本数据集,包含300,506个音频片段及其对应的转录文本,主要用于训练自动语音识别模型,特别是针对动漫和其他类似日本媒体中的对话。数据集来源于视觉小说,音频格式为mp3 (128kbps),平均音频长度为5.5秒。与V1版本相比,V2版本显著增加了数据集大小,并改变了音频格式以提高存储效率。此外,V2版本未过滤NSFW内容,未来可能会将数据集分为安全内容和NSFW内容。数据集存在一些固有的偏见和局限性,如性别偏见和领域特定词汇。未来计划包括创建安全内容和NSFW内容的分割、改进转录质量以及继续扩展数据集。

Japanese Anime Speech Dataset V2是一个音频-文本数据集,包含300,506个音频片段及其对应的转录文本,主要用于训练自动语音识别模型,特别是针对动漫和其他类似日本媒体中的对话。数据集来源于视觉小说,音频格式为mp3 (128kbps),平均音频长度为5.5秒。与V1版本相比,V2版本显著增加了数据集大小,并改变了音频格式以提高存储效率。此外,V2版本未过滤NSFW内容,未来可能会将数据集分为安全内容和NSFW内容。数据集存在一些固有的偏见和局限性,如性别偏见和领域特定词汇。未来计划包括创建安全内容和NSFW内容的分割、改进转录质量以及继续扩展数据集。
提供机构:
joujiboi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作