five

TLME/Umamusume-voice-transcription

收藏
Hugging Face2023-08-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TLME/Umamusume-voice-transcription
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit language: - ja tags: - Audio --- # Umamusume-voice-transcription Total charcters: 77 Comes with transcription. This is the dataset of this [repository](https://huggingface.co/TLME/RVC-Umamusume). ## Voices Time Sum: <small> 东商变革(スイープトウショウ),时长总和:799.4399999999996秒<br> 东海帝皇(トウカイテイオー),时长总和:1074.0949999999998秒<br> 东瀛佐敦(トーセンジョーダン),时长总和:800.8589999999999秒<br> 丸善斯基(マルゼンスキー),时长总和:1140.2329999999993秒<br> 也文摄辉(ヤマニンゼファー),时长总和:1018.7590000000001秒<br> 伏特加(ウオッカ),时长总和:1117.798999999999秒<br> 优秀素质(ナイスネイチャ),时长总和:1186.9069999999995秒<br> 八重无敌(ヤエノムテキ),时长总和:713.699秒<br> 北港火山(ホッコータルマエ),时长总和:978.3929999999998秒<br> 北部玄驹(キタサンブラック),时长总和:1128.5840000000003秒<br> 千明代表(ミスターシービー),时长总和:620.9349999999998秒<br> 双涡轮(ツインターボ),时长总和:787.8899999999998秒<br> 吉兆(シンボリクリスエス),时长总和:916.8109999999998秒<br> 名将怒涛(メイショウドトウ),时长总和:1562.7600000000002秒<br> 大和赤骥(ダイワスカーレット),时长总和:986.7539999999995秒<br> 大拓太阳神(ダイタクヘリオス),时长总和:781.9179999999997秒<br> 大树快车(タイキシャトル),时长总和:1010.3729999999997秒<br> 奇锐骏(ワンダーアキュート),时长总和:1040.181秒<br> 好歌剧(テイエムオペラオー),时长总和:1077.7399999999996秒<br> 富士奇迹(フジキセキ),时长总和:1136.177秒<br> 小林历奇(コパノリッキー),时长总和:790.2309999999999秒<br> 小栗帽(オグリキャップ),时长总和:1075.5210000000004秒<br> 川上公主(カワカミプリンセス),时长总和:801.9759999999999秒<br> 帝王光辉(キングヘイロー),时长总和:1103.0879999999995秒<br> 待兼福来(マチカネフクキタル),时长总和:1130.578秒<br> 待兼诗歌剧(マチカネタンホイザ),时长总和:1113.5250000000008秒<br> 成田大进(ナリタタイシン),时长总和:1061.7379999999998秒<br> 成田白仁(ナリタブライアン),时长总和:947.5480000000003秒<br> 摩耶重炮(マヤノトップガン),时长总和:1097.5780000000002秒<br> 新光风(シンコウウインディ),时长总和:751.8529999999995秒<br> 新宇宙(ネオユニヴァース),时长总和:1207.2579999999998秒<br> 无声铃鹿(サイレンススズカ),时长总和:689.8119999999998秒<br> 春乌拉拉(ハルウララ),时长总和:964.2250000000005秒<br> 曼城茶座(マンハッタンカフェ),时长总和:737.7869999999995秒<br> 樱花千代王(サクラチヨノオー),时长总和:1064.3539999999998秒<br> 樱花桂冠(サクラローレル),时长总和:742.7629999999999秒<br> 樱花进王(サクラバクシンオー),时长总和:1019.4860000000002秒<br> 气槽(エアグルーヴ),时长总和:1020.7820000000008秒<br> 爱丽数码(アグネスデジタル),时长总和:1165.6479999999997秒<br> 爱丽速子(アグネスタキオン),时长总和:846.0569999999996秒<br> 爱慕织姬(アドマイヤベガ),时长总和:860.4819999999995秒<br> 特别周(スペシャルウィーク),时长总和:1234.384秒<br> 玉藻十字(タマモクロス),时长总和:965.0990000000002秒<br> 琵琶晨光(ビワハヤヒデ),时长总和:1136.2230000000002秒<br> 目白光明(メジロブライト),时长总和:1053.2420000000004秒<br> 目白善信(メジロパーマー),时长总和:830.1220000000002秒<br> 目白多伯(メジロドーベル),时长总和:1505.0610000000006秒<br> 目白赖恩(メジロライアン),时长总和:965.3450000000004秒<br> 目白阿尔丹(メジロアルダン),时长总和:1400.0969999999998秒<br> 目白麦昆(メジロマックイーン),时长总和:1276.6769999999997秒<br> 真弓快车(アストンマーチャン),时长总和:1078.758秒<br> 真机伶(カレンチャン),时长总和:1335.5170000000003秒<br> 神鹰(エルコンドルパサー),时长总和:1202.517秒<br> 稻荷一(イナリワン),时长总和:1059.794秒<br> 空中神宫(エアシャカール),时长总和:869.9939999999998秒<br> 第一红宝石(ダイイチルビー),时长总和:843.4040000000001秒<br> 米浴(ライスシャワー),时长总和:1443.8790000000001秒<br> 美妙姿势(ファインモーション),时长总和:1138.3140000000003秒<br> 美浦波旁(ミホノブルボン),时长总和:1106.4870000000003秒<br> 胜利奖券(ウイニングチケット),时长总和:1149.3560000000004秒<br> 草上飞(グラスワンダー),时长总和:1286.5190000000007秒<br> 荣进闪耀(エイシンフラッシュ),时长总和:1030.7060000000001秒<br> 菱亚马逊(ヒシアマゾン),时长总和:701.9640000000002秒<br> 菱曙(ヒシアケボノ),时长总和:685.5850000000003秒<br> 菱钻奇宝(ヒシミラクル),时长总和:855.4909999999999秒<br> 西野花(ニシノフラワー),时长总和:735.447秒<br> 谷水琴蕾(タニノギムレット),时长总和:861.8249999999998秒<br> 超级小海湾(スーパークリーク),时长总和:1152.5580000000004秒<br> 醒目飞鹰(スマートファルコン),时长总和:1071.993秒<br> 采珠(シーキングザパール),时长总和:913.8439999999999秒<br> 里见光钻(サトノダイヤモンド),时长总和:1050.1169999999997秒<br> 雪之美人(ユキノビジン),时长总和:988.6159999999999秒<br> 青云天空(セイウンスカイ),时长总和:1164.7540000000006秒<br> 青竹回忆(バンブーメモリー),时长总和:792.066秒<br> 鲁道夫象征(シンボリルドルフ),时长总和:1027.4490000000003秒<br> 黄金城(ゴールドシチー),时长总和:1284.0510000000004秒<br> 黄金船(ゴールドシップ),时长总和:928.7449999999999秒<br> </small>

许可证:MIT许可证(MIT License) 语言: - 日语 标签: - 音频(Audio) --- # 赛马娘语音转录数据集(Umamusume-voice-transcription) 总字符数:77 本数据集附带语音转录文本。 本数据集源自下述仓库:<https://huggingface.co/TLME/RVC-Umamusume> ## 语音总时长: <small> 东商变革(スイープトウショウ),总时长:799.4399999999996秒<br> 东海帝皇(トウカイテイオー),总时长:1074.0949999999998秒<br> 东瀛佐敦(トーセンジョーダン),总时长:800.8589999999999秒<br> 丸善斯基(マルゼンスキー),总时长:1140.2329999999993秒<br> 也文摄辉(ヤマニンゼファー),总时长:1018.7590000000001秒<br> 伏特加(ウオッカ),总时长:1117.798999999999秒<br> 优秀素质(ナイスネイチャ),总时长:1186.9069999999995秒<br> 八重无敌(ヤエノムテキ),总时长:713.699秒<br> 北港火山(ホッコータルマエ),总时长:978.3929999999998秒<br> 北部玄驹(キタサンブラック),总时长:1128.5840000000003秒<br> 千明代表(ミスターシービー),总时长:620.9349999999998秒<br> 双涡轮(ツインターボ),总时长:787.8899999999998秒<br> 吉兆(シンボリクリスエス),总时长:916.8109999999998秒<br> 名将怒涛(メイショウドトウ),总时长:1562.7600000000002秒<br> 大和赤骥(ダイワスカーレット),总时长:986.7539999999995秒<br> 大拓太阳神(ダイタクヘリオス),总时长:781.9179999999997秒<br> 大树快车(タイキシャトル),总时长:1010.3729999999997秒<br> 奇锐骏(ワンダーアキュート),总时长:1040.181秒<br> 好歌剧(テイエムオペラオー),总时长:1077.7399999999996秒<br> 富士奇迹(フジキセキ),总时长:1136.177秒<br> 小林历奇(コパノリッキー),总时长:790.2309999999999秒<br> 小栗帽(オグリキャップ),总时长:1075.5210000000004秒<br> 川上公主(カワカミプリンセス),总时长:801.9759999999999秒<br> 帝王光辉(キングヘイロー),总时长:1103.0879999999995秒<br> 待兼福来(マチカネフクキタル),总时长:1130.578秒<br> 待兼诗歌剧(マチカネタンホイザ),总时长:1113.5250000000008秒<br> 成田大进(ナリタタイシン),总时长:1061.7379999999998秒<br> 成田白仁(ナリタブライアン),总时长:947.5480000000003秒<br> 摩耶重炮(マヤノトップガン),总时长:1097.5780000000002秒<br> 新光风(シンコウウインディ),总时长:751.8529999999995秒<br> 新宇宙(ネオユニヴァース),总时长:1207.2579999999998秒<br> 无声铃鹿(サイレンススズカ),总时长:689.8119999999998秒<br> 春乌拉拉(ハルウララ),总时长:964.2250000000005秒<br> 曼城茶座(マンハッタンカフェ),总时长:737.7869999999995秒<br> 樱花千代王(サクラチヨノオー),总时长:1064.3539999999998秒<br> 樱花桂冠(サクラローレル),总时长:742.7629999999999秒<br> 樱花进王(サクラバクシンオー),总时长:1019.4860000000002秒<br> 气槽(エアグルーヴ),总时长:1020.7820000000008秒<br> 爱丽数码(アグネスデジタル),总时长:1165.6479999999997秒<br> 爱丽速子(アグネスタキオン),总时长:846.0569999999996秒<br> 爱慕织姬(アドマイヤベガ),总时长:860.4819999999995秒<br> 特别周(スペシャルウィーク),总时长:1234.384秒<br> 玉藻十字(タマモクロス),总时长:965.0990000000002秒<br> 琵琶晨光(ビワハヤヒデ),总时长:1136.2230000000002秒<br> 目白光明(メジロブライト),总时长:1053.2420000000004秒<br> 目白善信(メジロパーマー),总时长:830.1220000000002秒<br> 目白多伯(メジロドーベル),总时长:1505.0610000000006秒<br> 目白赖恩(メジロライアン),总时长:965.3450000000004秒<br> 目白阿尔丹(メジロアルダン),总时长:1400.0969999999998秒<br> 目白麦昆(メジロマックイーン),总时长:1276.6769999999997秒<br> 真弓快车(アストンマーチャン),总时长:1078.758秒<br> 真机伶(カレンチャン),总时长:1335.5170000000003秒<br> 神鹰(エルコンドルパサー),总时长:1202.517秒<br> 稻荷一(イナリワン),总时长:1059.794秒<br> 空中神宫(エアシャカール),总时长:869.9939999999998秒<br> 第一红宝石(ダイイチルビー),总时长:843.4040000000001秒<br> 米浴(ライスシャワー),总时长:1443.8790000000001秒<br> 美妙姿势(ファインモーション),总时长:1138.3140000000003秒<br> 美浦波旁(ミホノブルボン),总时长:1106.4870000000003秒<br> 胜利奖券(ウイニングチケット),总时长:1149.3560000000004秒<br> 草上飞(グラスワンダー),总时长:1286.5190000000007秒<br> 荣进闪耀(エイシンフラッシュ),总时长:1030.7060000000001秒<br> 菱亚马逊(ヒシアマゾン),总时长:701.9640000000002秒<br> 菱曙(ヒシアケボノ),总时长:685.5850000000003秒<br> 菱钻奇宝(ヒシミラクル),总时长:855.4909999999999秒<br> 西野花(ニシノフラワー),总时长:735.447秒<br> 谷水琴蕾(タニノギムレット),总时长:861.8249999999998秒<br> 超级小海湾(スーパークリーク),总时长:1152.5580000000004秒<br> 醒目飞鹰(スマートファルコン),总时长:1071.993秒<br> 采珠(シーキングザパール),总时长:913.8439999999999秒<br> 里见光钻(サトノダイヤモンド),总时长:1050.1169999999997秒<br> 雪之美人(ユキノビジン),总时长:988.6159999999999秒<br> 青云天空(セイウンスカイ),总时长:1164.7540000000006秒<br> 青竹回忆(バンブーメモリー),总时长:792.066秒<br> 鲁道夫象征(シンボリルドルフ),总时长:1027.4490000000003秒<br> 黄金城(ゴールドシチー),总时长:1284.0510000000004秒<br> 黄金船(ゴールドシップ),总时长:928.7449999999999秒<br> </small>
提供机构:
TLME
原始信息汇总

Umamusume-voice-transcription 数据集概述

基本信息

  • 许可证: MIT
  • 语言: 日语 (ja)
  • 标签: Audio

数据集内容

  • 总字符数: 77
  • 包含内容: 语音转录文本

语音数据统计

  • 东商变革(スイープトウショウ): 799.44秒
  • 东海帝皇(トウカイテイオー): 1074.09秒
  • 东瀛佐敦(トーセンジョーダン): 800.86秒
  • 丸善斯基(マルゼンスキー): 1140.23秒
  • 也文摄辉(ヤマニンゼファー): 1018.76秒
  • 伏特加(ウオッカ): 1117.80秒
  • 优秀素质(ナイスネイチャ): 1186.91秒
  • 八重无敌(ヤエノムテキ): 713.70秒
  • 北港火山(ホッコータルマエ): 978.39秒
  • 北部玄驹(キタサンブラック): 1128.58秒
  • 千明代表(ミスターシービー): 620.93秒
  • 双涡轮(ツインターボ): 787.89秒
  • 吉兆(シンボリクリスエス): 916.81秒
  • 名将怒涛(メイショウドトウ): 1562.76秒
  • 大和赤骥(ダイワスカーレット): 986.75秒
  • 大拓太阳神(ダイタクヘリオス): 781.92秒
  • 大树快车(タイキシャトル): 1010.37秒
  • 奇锐骏(ワンダーアキュート): 1040.18秒
  • 好歌剧(テイエムオペラオー): 1077.74秒
  • 富士奇迹(フジキセキ): 1136.18秒
  • 小林历奇(コパノリッキー): 790.23秒
  • 小栗帽(オグリキャップ): 1075.52秒
  • 川上公主(カワカミプリンセス): 801.98秒
  • 帝王光辉(キングヘイロー): 1103.09秒
  • 待兼福来(マチカネフクキタル): 1130.58秒
  • 待兼诗歌剧(マチカネタンホイザ): 1113.53秒
  • 成田大进(ナリタタイシン): 1061.74秒
  • 成田白仁(ナリタブライアン): 947.55秒
  • 摩耶重炮(マヤノトップガン): 1097.58秒
  • 新光风(シンコウウインディ): 751.85秒
  • 新宇宙(ネオユニヴァース): 1207.26秒
  • 无声铃鹿(サイレンススズカ): 689.81秒
  • 春乌拉拉(ハルウララ): 964.23秒
  • 曼城茶座(マンハッタンカフェ): 737.79秒
  • 樱花千代王(サクラチヨノオー): 1064.35秒
  • 樱花桂冠(サクラローレル): 742.76秒
  • 樱花进王(サクラバクシンオー): 1019.49秒
  • 气槽(エアグルーヴ): 1020.78秒
  • 爱丽数码(アグネスデジタル): 1165.65秒
  • 爱丽速子(アグネスタキオン): 846.06秒
  • 爱慕织姬(アドマイヤベガ): 860.48秒
  • 特别周(スペシャルウィーク): 1234.38秒
  • 玉藻十字(タマモクロス): 965.10秒
  • 琵琶晨光(ビワハヤヒデ): 1136.22秒
  • 目白光明(メジロブライト): 1053.24秒
  • 目白善信(メジロパーマー): 830.12秒
  • 目白多伯(メジロドーベル): 1505.06秒
  • 目白赖恩(メジロライアン): 965.35秒
  • 目白阿尔丹(メジロアルダン): 1400.10秒
  • 目白麦昆(メジロマックイーン): 1276.68秒
  • 真弓快车(アストンマーチャン): 1078.76秒
  • 真机伶(カレンチャン): 1335.52秒
  • 神鹰(エルコンドルパサー): 1202.52秒
  • 稻荷一(イナリワン): 1059.79秒
  • 空中神宫(エアシャカール): 869.99秒
  • 第一红宝石(ダイイチルビー): 843.40秒
  • 米浴(ライスシャワー): 1443.88秒
  • 美妙姿势(ファインモーション): 1138.31秒
  • 美浦波旁(ミホノブルボン): 1106.49秒
  • 胜利奖券(ウイニングチケット): 1149.36秒
  • 草上飞(グラスワンダー): 1286.52秒
  • 荣进闪耀(エイシンフラッシュ): 1030.71秒
  • 菱亚马逊(ヒシアマゾン): 701.96秒
  • 菱曙(ヒシアケボノ): 685.59秒
  • 菱钻奇宝(ヒシミラクル): 855.49秒
  • 西野花(ニシノフラワー): 735.45秒
  • 谷水琴蕾(タニノギムレット): 861.82秒
  • 超级小海湾(スーパークリーク): 1152.56秒
  • 醒目飞鹰(スマートファルコン): 1071.99秒
  • 采珠(シーキングザパール): 913.84秒
  • 里见光钻(サトノダイヤモンド): 1050.12秒
  • 雪之美人(ユキノビジン): 988.62秒
  • 青云天空(セイウンスカイ): 1164.75秒
  • 青竹回忆(バンブーメモリー): 792.07秒
  • 鲁道夫象征(シンボリルドルフ): 1027.45秒
  • 黄金城(ゴールドシチー): 1284.05秒
  • 黄金船(ゴールドシップ): 928.74秒
搜集汇总
数据集介绍
main_image_url
构建方式
在语音识别与合成领域,高质量标注的音频数据集对于模型训练至关重要。本数据集源自《赛马娘》游戏角色语音,通过系统化采集与人工转录构建而成。数据涵盖77位角色的日文语音片段,每条音频均配有精确的文本转录,确保了语音与文本的对齐质量。构建过程中,语音素材经过统一预处理,剔除了背景噪音与无效片段,保证了数据的纯净度与一致性,为后续语音处理任务奠定了坚实基础。
使用方法
在语音技术研究中,本数据集适用于多种下游任务。研究者可借助其音频-文本配对数据,训练端到端的语音识别模型,或用于语音合成系统的声学建模。数据已按角色分类,便于进行角色特定的语音分析或跨角色对比研究。使用前需确保符合MIT许可协议,建议结合原始仓库中的工具进行数据预处理与特征提取,以充分发挥其在多说话人语音处理领域的潜力。
背景与挑战
背景概述
在语音识别与合成技术蓬勃发展的背景下,TLME/Umamusume-voice-transcription数据集应运而生,专注于日语语音转录任务。该数据集由TLME团队创建,依托于热门多媒体内容《赛马娘》中的角色语音资源,旨在为语音技术研究提供高质量的标注语料。其核心研究问题在于如何从特定领域的音频数据中提取精准的文本转录,以支持语音识别模型的训练与优化。该数据集的构建不仅丰富了日语语音资源的多样性,也为角色语音合成、声纹识别等应用领域提供了重要的数据基础,推动了娱乐技术与人工智能的交叉融合。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,语音转录任务需应对日语语音的复杂性,如方言变体、情感语调的细微差异以及角色特有的发音风格,这些因素增加了识别准确性的难度;在构建过程中,数据采集与标注面临诸多困难,包括从原始多媒体资源中提取纯净音频、处理背景噪音干扰,以及确保77位角色语音转录文本的一致性与准确性,这些都需要耗费大量人力进行精细校对与质量控制。
常用场景
经典使用场景
在语音识别与合成领域,Umamusume-voice-transcription数据集以其丰富的日语语音素材和精准的文本转录,为研究者提供了宝贵的资源。该数据集收录了《赛马娘》游戏中多位角色的语音片段,涵盖了多样化的语音风格和情感表达,常用于训练和评估自动语音识别系统。通过利用这些高质量的语音-文本配对数据,研究人员能够深入探索日语语音的声学特征与语言结构之间的复杂关系,进而优化识别模型的性能。
解决学术问题
该数据集有效解决了日语语音识别中因缺乏大规模、高质量标注数据而面临的挑战。在自然语言处理研究中,日语因其独特的音韵体系和复杂的书写系统,常导致识别准确率受限。Umamusume-voice-transcription通过提供精确的语音转录,支持了端到端语音识别模型的开发,促进了跨语言语音技术的研究。其意义在于填补了日语语音数据资源的空白,为学术社区提供了可复现的实验基础,推动了语音处理技术的国际化发展。
实际应用
在实际应用中,Umamusume-voice-transcription数据集被广泛用于构建智能语音助手和虚拟角色交互系统。例如,在游戏开发和娱乐产业中,该数据集可用于生成个性化的角色语音,增强用户体验。此外,它还能支持教育领域的语言学习工具,帮助学习者通过模仿标准发音提升日语口语能力。这些应用不仅展示了语音技术的商业化潜力,也体现了数据集在推动人机交互创新方面的实用价值。
数据集最近研究
最新研究方向
在语音技术与数字娱乐融合的背景下,TLME/Umamusume-voice-transcription数据集以其丰富的日语语音转录内容,为语音合成与识别领域注入了新的活力。该数据集聚焦于《赛马娘》角色语音,涵盖77位角色的高精度转录音频,总时长可观,为多说话人语音建模提供了扎实基础。前沿研究正探索基于此类数据的个性化语音克隆技术,结合生成对抗网络与迁移学习,实现角色声音的高保真复现与情感迁移。同时,该数据集也推动了跨语言语音合成的研究,助力虚拟偶像与互动娱乐中自然对话系统的开发。其影响不仅限于学术探索,更在游戏本地化、虚拟内容创作等产业中展现出广阔应用前景,体现了语音数据在文化数字化进程中的关键价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作