nisheeth/English-TamilBrailleCorpus
收藏Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nisheeth/English-TamilBrailleCorpus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个英语到泰米尔盲文的平行对齐语料库,包含377,243个对齐句子。该项目由印度政府Anusandhan国家研究基金会(前身为SERB)资助,旨在开发一个将英语文本转录为Bharati盲文的机器辅助翻译系统。Bharati盲文是印度语言的统一盲文脚本。该研究将帮助那些因缺乏Bharati盲文文献而无法获取知识的视障人士,因为能够读写盲文为他们打开了识字、智力自由、平等机会和个人安全的大门。
该数据集是一个英语到泰米尔盲文的平行对齐语料库,包含377,243个对齐句子。该项目由印度政府Anusandhan国家研究基金会(前身为SERB)资助,旨在开发一个将英语文本转录为Bharati盲文的机器辅助翻译系统。Bharati盲文是印度语言的统一盲文脚本。该研究将帮助那些因缺乏Bharati盲文文献而无法获取知识的视障人士,因为能够读写盲文为他们打开了识字、智力自由、平等机会和个人安全的大门。
提供机构:
nisheeth
原始信息汇总
English - Tamil Braille Parallel Aligned Corpus
基本信息
- 许可证: cc-by-sa-4.0
- 任务类别: 翻译
- 数据集大小: 100M<n<1B
数据集描述
- 内容: 包含377243句英文到泰米尔盲文的平行对齐句子。
- 支持: 该项目由印度政府Anusandhan国家研究基金会(前SERB)资助,项目编号为CRG/2020/004246。
项目概述
该项目旨在开发一个系统,能够将英文文本转换为Bharti Braille,这是一种印度语言的统一盲文脚本。项目将开发一个特定领域的英语-印地语语料库(如艺术和文化领域),随后开发机器翻译系统并进行评估。此研究对希望学习和获取知识但因缺乏Bharti Braille文献而受限的视觉障碍人士至关重要。
资源编号
- 国际标准语言资源编号 (ISLRN): 251-900-154-265-4



