five

nisheeth/English-HindiBrailleCorpus

收藏
Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nisheeth/English-HindiBrailleCorpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1103842个平行对齐的英语到印地语盲文句子,旨在支持开发一个将英语文本转录为Bharati盲文的系统。该项目由印度政府的研究基金会资助,背景是视障人士由于缺乏将文本材料转录为盲文的资源,无法获取大量知识。项目希望通过开发一个混合机器辅助翻译系统来解决这一问题,并特别选择了Bharati盲文,因为它是印度语言的统一盲文脚本。

该数据集包含1103842个平行对齐的英语到印地语盲文句子,旨在支持开发一个将英语文本转录为Bharati盲文的系统。该项目由印度政府的研究基金会资助,背景是视障人士由于缺乏将文本材料转录为盲文的资源,无法获取大量知识。项目希望通过开发一个混合机器辅助翻译系统来解决这一问题,并特别选择了Bharati盲文,因为它是印度语言的统一盲文脚本。
提供机构:
nisheeth
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 翻译
  • 大小类别: 100M<n<1B

数据集内容

  • 描述: 包含1103842条平行对齐的句子,用于英语到印度盲文(Bharti Braille)的语言对翻译。

项目背景与目的

  • 资助: 由印度政府Anusandhan国家研究基金会(前SERB)通过资助号CRG/2020/004246支持。
  • 目标: 开发一个系统,将英语文本转换为印度盲文,以帮助视障人士获取知识。
  • 方法: 开发特定领域的英语-印地语语料库(如艺术与文化领域),随后开发机器翻译系统并进行评估。

重要性

  • 社会影响: 该系统对视障人士至关重要,因为它为他们提供了阅读和写作的能力,从而打开了通向文化、知识和个人安全的大门。

附加信息

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作