five

nisheeth/English-TamilBrailleCorpus

收藏
Hugging Face2024-04-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nisheeth/English-TamilBrailleCorpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个英语到泰米尔盲文的平行对齐语料库,包含377,243个对齐句子。该项目由印度政府Anusandhan国家研究基金会(前身为SERB)资助,旨在开发一个将英语文本转录为Bharati盲文的机器辅助翻译系统。Bharati盲文是印度语言的统一盲文脚本。该研究将帮助那些因缺乏Bharati盲文文献而无法获取知识的视障人士,因为能够读写盲文为他们打开了识字、智力自由、平等机会和个人安全的大门。

该数据集是一个英语到泰米尔盲文的平行对齐语料库,包含377,243个对齐句子。该项目由印度政府Anusandhan国家研究基金会(前身为SERB)资助,旨在开发一个将英语文本转录为Bharati盲文的机器辅助翻译系统。Bharati盲文是印度语言的统一盲文脚本。该研究将帮助那些因缺乏Bharati盲文文献而无法获取知识的视障人士,因为能够读写盲文为他们打开了识字、智力自由、平等机会和个人安全的大门。
提供机构:
nisheeth
原始信息汇总

English - Tamil Braille Parallel Aligned Corpus

基本信息

  • 许可证: cc-by-sa-4.0
  • 任务类别: 翻译
  • 数据集大小: 100M<n<1B

数据集描述

  • 内容: 包含377243句英文到泰米尔盲文的平行对齐句子。
  • 支持: 该项目由印度政府Anusandhan国家研究基金会(前SERB)资助,项目编号为CRG/2020/004246。

项目概述

该项目旨在开发一个系统,能够将英文文本转换为Bharti Braille,这是一种印度语言的统一盲文脚本。项目将开发一个特定领域的英语-印地语语料库(如艺术和文化领域),随后开发机器翻译系统并进行评估。此研究对希望学习和获取知识但因缺乏Bharti Braille文献而受限的视觉障碍人士至关重要。

资源编号

  • 国际标准语言资源编号 (ISLRN): 251-900-154-265-4
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作