five

ogbi/ikk_bible_JHNandMRK_chapter1_to_10

收藏
Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ogbi/ikk_bible_JHNandMRK_chapter1_to_10
下载链接
链接失效反馈
官方服务:
资源简介:
Ikaaudio数据集包含Ika语言新约圣经前10章的音频片段。这些片段经过手动验证,确保音频与转录内容匹配。数据集使用了Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行分割,并由ikabible.org的人员进行注释和录制。数据集不包含个人身份信息,但涉及宗教文本,可能对某些用户敏感。数据集的主要用途是支持低资源语言的数字表示,特别是Ika语言,但也存在性别偏见和宗教敏感性等潜在问题。

Ikaaudio数据集包含Ika语言新约圣经前10章的音频片段。这些片段经过手动验证,确保音频与转录内容匹配。数据集使用了Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行分割,并由ikabible.org的人员进行注释和录制。数据集不包含个人身份信息,但涉及宗教文本,可能对某些用户敏感。数据集的主要用途是支持低资源语言的数字表示,特别是Ika语言,但也存在性别偏见和宗教敏感性等潜在问题。
提供机构:
ogbi
原始信息汇总

ikk_bible_JHNandMRK_chapter1_to_10 数据集概述

数据集描述

  • 内容: 包含Ika翻译的新约圣经中约翰和马可福音的前10章的音频片段。
  • 质量保证: 音频片段经过手动验证,确保转录与音频匹配度高。
  • 技术应用: 使用Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行章节分割和校验。

语言信息

  • 语言: Ika语言(ISO 639-3代码:ikk),从英语翻译并录制。

标注过程

  • 翻译与录制: 从英语翻译到Ika,并进行文本的阅读和录音。
  • 标注人员: 由ikabible.org的人员进行,由Faith Comes By Hearing赞助。

敏感信息

  • 内容敏感性: 包含新约圣经文本,可能对某些人敏感。
  • 性别信息: 主要演讲者为男性。

使用考虑

  • 社会影响: 有助于低资源语言Ika的数字化,但需注意宗教内容的敏感性。
  • 偏见讨论: 主要由男性演讲者构成,可能引入特定偏见。
  • 其他限制: 未分为训练集和测试集,用户可能需手动划分。

附加信息

  • 数据集管理: 精心校验所有片段和转录的匹配。
  • 引用信息: 引用细节将由数据集创建者提供。
  • 许可证: 根据Apache License 2.0分发。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作