nisheeth/English-HindiBrailleCorpus

Name: nisheeth/English-HindiBrailleCorpus
Creator: nisheeth
Published: 2024-04-22 14:19:41
License: 暂无描述

Hugging Face2024-04-22 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/nisheeth/English-HindiBrailleCorpus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含1103842个平行对齐的英语到印地语盲文句子，旨在支持开发一个将英语文本转录为Bharati盲文的系统。该项目由印度政府的研究基金会资助，背景是视障人士由于缺乏将文本材料转录为盲文的资源，无法获取大量知识。项目希望通过开发一个混合机器辅助翻译系统来解决这一问题，并特别选择了Bharati盲文，因为它是印度语言的统一盲文脚本。

提供机构：

nisheeth

原始信息汇总

数据集概述

基本信息

许可证: MIT
任务类别: 翻译
大小类别: 100M<n<1B

数据集内容

描述: 包含1103842条平行对齐的句子，用于英语到印度盲文（Bharti Braille）的语言对翻译。

项目背景与目的

资助: 由印度政府Anusandhan国家研究基金会（前SERB）通过资助号CRG/2020/004246支持。
目标: 开发一个系统，将英语文本转换为印度盲文，以帮助视障人士获取知识。
方法: 开发特定领域的英语-印地语语料库（如艺术与文化领域），随后开发机器翻译系统并进行评估。

重要性

社会影响: 该系统对视障人士至关重要，因为它为他们提供了阅读和写作的能力，从而打开了通向文化、知识和个人安全的大门。

附加信息

国际标准语言资源编号: 706-392-416-361-8
详细信息链接: https://prism.serbonline.in/SRPIProfile/MTAxMDQ5MTQ=

5,000+

优质数据集

54 个

任务类型

进入经典数据集