five

alayaran/bodo_english_parallel

收藏
Hugging Face2023-08-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alayaran/bodo_english_parallel
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个Bodo语和英语之间的平行翻译数据集,包含149,018条训练数据。每条数据包括一个ID和一个翻译对,翻译对由Bodo语和英语的句子组成。数据集适用于机器翻译任务,旨在支持Bodo语和英语之间的语言翻译研究。
提供机构:
alayaran
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 语言:
    • 博多语 (brx)
    • 英语 (en)
  • 任务类别: 翻译
  • 数据集名称: bodo_english_parallel_dataset
  • 数据规模: 10K<n<100K

数据集结构

  • 数据集类型: DatasetDict
  • 训练集:
    • 特征: [id, translation]
    • 行数: 149018

示例数据

  • 最后三条数据:
    • id: [149015, 149016, 149017]
    • translation:
      • 博多语: "गोबां बिबां आरो गोजौ-थ्रूपुट थाखो फारि खालामग्रा आरोंदायारि गोनोखो फैनायनि उनाव, जों दा गोबां गोजौ-रोजाथि जिनम थाखो फारियारि खारि आरो मोनसे जिबख्रियारि थाखोखौ लाफाना फांसे बिफांनि गुबुन-गुबुन बाहागोनिफ्राय ट्रांसक्रिप्टोम खारिबो दिहुन्नो हाबाय, "वार्ष्णेयया बुङो।
      • 英语: "With the advent of large-scale and high-throughput sequencing technologies, we are now able to generate large high-density genome sequencing data and also transcriptome data from various parts of a plant including at single cell level," says Varshney.
      • 博多语: "इयुन्नि जौगानायनि राहाया गोथौ बिजिरसंफोराव थायो, गाहाय महरै बेटारी आरोंदायारि गोनोखोआव आरो ई.व. चार्ज खालामग्रा पइन्ट आरो बेटारिफोरखौ बाहायफिन्नायखौ लाफानानै ई.व. लुनायनि सानजथाय गुवारै गोसार होनायाव थायो।"
      • 英语: The key to future growth lies in deep research, specifically in battery technology and in wider deployment of E.V. infrastructure, including charging points and recycling of batteries.
      • 博多语: "बै सांग्रांथि होसेयावबो, बिथाङा बे नंगुबै तथ्ययाव फैनौ जुजिदोंमोन दि बिथाङा जाय थांखिगोनां बिजिरसं मावथांखिखौ जागायदोंमोन,बियो इं 2003 माइथायनि सोमखोर जांख्रिथायनि बिफा नरमेन बरलगनि मोनसे बिबुंथिनिफ्राय थुलुंगा जादोंमोन, जाय रोदा सुनो फेलें जादोंमोन।"
      • 英语: Despite that awareness, he struggled to come to terms with the fact that the ambitious research project he had embarked upon, inspired by a speech in 2003 by Norman Borlaug, the Father of Green Revolution, had failed to take root.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作