alayaran/bodo_english_parallel
收藏Hugging Face2023-08-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alayaran/bodo_english_parallel
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个Bodo语和英语之间的平行翻译数据集,包含149,018条训练数据。每条数据包括一个ID和一个翻译对,翻译对由Bodo语和英语的句子组成。数据集适用于机器翻译任务,旨在支持Bodo语和英语之间的语言翻译研究。
提供机构:
alayaran
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 语言:
- 博多语 (brx)
- 英语 (en)
- 任务类别: 翻译
- 数据集名称: bodo_english_parallel_dataset
- 数据规模: 10K<n<100K
数据集结构
- 数据集类型: DatasetDict
- 训练集:
- 特征: [id, translation]
- 行数: 149018
示例数据
- 最后三条数据:
- id: [149015, 149016, 149017]
- translation:
- 博多语: "गोबां बिबां आरो गोजौ-थ्रूपुट थाखो फारि खालामग्रा आरोंदायारि गोनोखो फैनायनि उनाव, जों दा गोबां गोजौ-रोजाथि जिनम थाखो फारियारि खारि आरो मोनसे जिबख्रियारि थाखोखौ लाफाना फांसे बिफांनि गुबुन-गुबुन बाहागोनिफ्राय ट्रांसक्रिप्टोम खारिबो दिहुन्नो हाबाय, "वार्ष्णेयया बुङो।
- 英语: "With the advent of large-scale and high-throughput sequencing technologies, we are now able to generate large high-density genome sequencing data and also transcriptome data from various parts of a plant including at single cell level," says Varshney.
- 博多语: "इयुन्नि जौगानायनि राहाया गोथौ बिजिरसंफोराव थायो, गाहाय महरै बेटारी आरोंदायारि गोनोखोआव आरो ई.व. चार्ज खालामग्रा पइन्ट आरो बेटारिफोरखौ बाहायफिन्नायखौ लाफानानै ई.व. लुनायनि सानजथाय गुवारै गोसार होनायाव थायो।"
- 英语: The key to future growth lies in deep research, specifically in battery technology and in wider deployment of E.V. infrastructure, including charging points and recycling of batteries.
- 博多语: "बै सांग्रांथि होसेयावबो, बिथाङा बे नंगुबै तथ्ययाव फैनौ जुजिदोंमोन दि बिथाङा जाय थांखिगोनां बिजिरसं मावथांखिखौ जागायदोंमोन,बियो इं 2003 माइथायनि सोमखोर जांख्रिथायनि बिफा नरमेन बरलगनि मोनसे बिबुंथिनिफ्राय थुलुंगा जादोंमोन, जाय रोदा सुनो फेलें जादोंमोन।"
- 英语: Despite that awareness, he struggled to come to terms with the fact that the ambitious research project he had embarked upon, inspired by a speech in 2003 by Norman Borlaug, the Father of Green Revolution, had failed to take root.



