nisheeth/English-HindiBrailleCorpus
收藏Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nisheeth/English-HindiBrailleCorpus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1103842个平行对齐的英语到印地语盲文句子,旨在支持开发一个将英语文本转录为Bharati盲文的系统。该项目由印度政府的研究基金会资助,背景是视障人士由于缺乏将文本材料转录为盲文的资源,无法获取大量知识。项目希望通过开发一个混合机器辅助翻译系统来解决这一问题,并特别选择了Bharati盲文,因为它是印度语言的统一盲文脚本。
该数据集包含1103842个平行对齐的英语到印地语盲文句子,旨在支持开发一个将英语文本转录为Bharati盲文的系统。该项目由印度政府的研究基金会资助,背景是视障人士由于缺乏将文本材料转录为盲文的资源,无法获取大量知识。项目希望通过开发一个混合机器辅助翻译系统来解决这一问题,并特别选择了Bharati盲文,因为它是印度语言的统一盲文脚本。
提供机构:
nisheeth
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 翻译
- 大小类别: 100M<n<1B
数据集内容
- 描述: 包含1103842条平行对齐的句子,用于英语到印度盲文(Bharti Braille)的语言对翻译。
项目背景与目的
- 资助: 由印度政府Anusandhan国家研究基金会(前SERB)通过资助号CRG/2020/004246支持。
- 目标: 开发一个系统,将英语文本转换为印度盲文,以帮助视障人士获取知识。
- 方法: 开发特定领域的英语-印地语语料库(如艺术与文化领域),随后开发机器翻译系统并进行评估。
重要性
- 社会影响: 该系统对视障人士至关重要,因为它为他们提供了阅读和写作的能力,从而打开了通向文化、知识和个人安全的大门。
附加信息
- 国际标准语言资源编号: 706-392-416-361-8
- 详细信息链接: https://prism.serbonline.in/SRPIProfile/MTAxMDQ5MTQ=



