five

oza75/mt-fr-bm-texts

收藏
Hugging Face2024-04-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/oza75/mt-fr-bm-texts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置都包含Bambara和French两种语言的数据。数据集主要用于训练,包含不同大小的数据分割,具体包括字典(dictionnary)、主要(main)、合成(synthetic)和转录(transcriptions)四种配置。每种配置的数据量和下载大小各不相同。

该数据集包含多个配置,每个配置都包含Bambara和French两种语言的数据。数据集主要用于训练,包含不同大小的数据分割,具体包括字典(dictionnary)、主要(main)、合成(synthetic)和转录(transcriptions)四种配置。每种配置的数据量和下载大小各不相同。
提供机构:
oza75
原始信息汇总

数据集概述

配置名称:dictionnary

  • 特征:
    • bambara: 数据类型为 string
    • french: 数据类型为 string
  • 分割:
    • train:
      • 字节数: 42871
      • 示例数: 636
  • 下载大小: 26609
  • 数据集大小: 42871

配置名称:main

  • 特征:
    • bambara: 数据类型为 string
    • french: 数据类型为 string
  • 分割:
    • train:
      • 字节数: 8363882
      • 示例数: 77307
  • 下载大小: 4821696
  • 数据集大小: 8363882

配置名称:synthetic

  • 特征:
    • French: 数据类型为 string
    • Bambara: 数据类型为 string
  • 分割:
    • train:
      • 字节数: 39287189
      • 示例数: 79376
  • 下载大小: 22597095
  • 数据集大小: 39287189

配置名称:transcriptions

  • 特征:
    • bambara: 数据类型为 string
    • french: 数据类型为 string
  • 分割:
    • train:
      • 字节数: 377011
      • 示例数: 4129
  • 下载大小: 226726
  • 数据集大小: 377011
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作