ogbi/ikk_bible_JHNandMRK_chapter1_to_10
收藏Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ogbi/ikk_bible_JHNandMRK_chapter1_to_10
下载链接
链接失效反馈官方服务:
资源简介:
Ikaaudio数据集包含Ika语言新约圣经前10章的音频片段。这些片段经过手动验证,确保音频与转录内容匹配。数据集使用了Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行分割,并由ikabible.org的人员进行注释和录制。数据集不包含个人身份信息,但涉及宗教文本,可能对某些用户敏感。数据集的主要用途是支持低资源语言的数字表示,特别是Ika语言,但也存在性别偏见和宗教敏感性等潜在问题。
Ikaaudio数据集包含Ika语言新约圣经前10章的音频片段。这些片段经过手动验证,确保音频与转录内容匹配。数据集使用了Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行分割,并由ikabible.org的人员进行注释和录制。数据集不包含个人身份信息,但涉及宗教文本,可能对某些用户敏感。数据集的主要用途是支持低资源语言的数字表示,特别是Ika语言,但也存在性别偏见和宗教敏感性等潜在问题。
提供机构:
ogbi
原始信息汇总
ikk_bible_JHNandMRK_chapter1_to_10 数据集概述
数据集描述
- 内容: 包含Ika翻译的新约圣经中约翰和马可福音的前10章的音频片段。
- 质量保证: 音频片段经过手动验证,确保转录与音频匹配度高。
- 技术应用: 使用Meta AI研究实验室开源的MMS_FA MMS Force Aligner进行章节分割和校验。
语言信息
- 语言: Ika语言(ISO 639-3代码:ikk),从英语翻译并录制。
标注过程
- 翻译与录制: 从英语翻译到Ika,并进行文本的阅读和录音。
- 标注人员: 由ikabible.org的人员进行,由Faith Comes By Hearing赞助。
敏感信息
- 内容敏感性: 包含新约圣经文本,可能对某些人敏感。
- 性别信息: 主要演讲者为男性。
使用考虑
- 社会影响: 有助于低资源语言Ika的数字化,但需注意宗教内容的敏感性。
- 偏见讨论: 主要由男性演讲者构成,可能引入特定偏见。
- 其他限制: 未分为训练集和测试集,用户可能需手动划分。
附加信息
- 数据集管理: 精心校验所有片段和转录的匹配。
- 引用信息: 引用细节将由数据集创建者提供。
- 许可证: 根据Apache License 2.0分发。



