nisheeth/English-TamilBrailleCorpus

Name: nisheeth/English-TamilBrailleCorpus
Creator: nisheeth
Published: 2024-04-22 14:15:22
License: 暂无描述

Hugging Face2024-04-22 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/nisheeth/English-TamilBrailleCorpus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个英语到泰米尔盲文的平行对齐语料库，包含377,243个对齐句子。该项目由印度政府Anusandhan国家研究基金会（前身为SERB）资助，旨在开发一个将英语文本转录为Bharati盲文的机器辅助翻译系统。Bharati盲文是印度语言的统一盲文脚本。该研究将帮助那些因缺乏Bharati盲文文献而无法获取知识的视障人士，因为能够读写盲文为他们打开了识字、智力自由、平等机会和个人安全的大门。

提供机构：

nisheeth

原始信息汇总

English - Tamil Braille Parallel Aligned Corpus

基本信息

许可证: cc-by-sa-4.0
任务类别: 翻译
数据集大小: 100M<n<1B

数据集描述

内容: 包含377243句英文到泰米尔盲文的平行对齐句子。
支持: 该项目由印度政府Anusandhan国家研究基金会（前SERB）资助，项目编号为CRG/2020/004246。

项目概述

该项目旨在开发一个系统，能够将英文文本转换为Bharti Braille，这是一种印度语言的统一盲文脚本。项目将开发一个特定领域的英语-印地语语料库（如艺术和文化领域），随后开发机器翻译系统并进行评估。此研究对希望学习和获取知识但因缺乏Bharti Braille文献而受限的视觉障碍人士至关重要。

资源编号

国际标准语言资源编号 (ISLRN): 251-900-154-265-4

5,000+

优质数据集

54 个

任务类型

进入经典数据集