oza75/mt-fr-bm-texts
收藏Hugging Face2024-04-23 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/oza75/mt-fr-bm-texts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置都包含Bambara和French两种语言的数据。数据集主要用于训练,包含不同大小的数据分割,具体包括字典(dictionnary)、主要(main)、合成(synthetic)和转录(transcriptions)四种配置。每种配置的数据量和下载大小各不相同。
该数据集包含多个配置,每个配置都包含Bambara和French两种语言的数据。数据集主要用于训练,包含不同大小的数据分割,具体包括字典(dictionnary)、主要(main)、合成(synthetic)和转录(transcriptions)四种配置。每种配置的数据量和下载大小各不相同。
提供机构:
oza75
原始信息汇总
数据集概述
配置名称:dictionnary
- 特征:
bambara: 数据类型为stringfrench: 数据类型为string
- 分割:
train:- 字节数: 42871
- 示例数: 636
- 下载大小: 26609
- 数据集大小: 42871
配置名称:main
- 特征:
bambara: 数据类型为stringfrench: 数据类型为string
- 分割:
train:- 字节数: 8363882
- 示例数: 77307
- 下载大小: 4821696
- 数据集大小: 8363882
配置名称:synthetic
- 特征:
French: 数据类型为stringBambara: 数据类型为string
- 分割:
train:- 字节数: 39287189
- 示例数: 79376
- 下载大小: 22597095
- 数据集大小: 39287189
配置名称:transcriptions
- 特征:
bambara: 数据类型为stringfrench: 数据类型为string
- 分割:
train:- 字节数: 377011
- 示例数: 4129
- 下载大小: 226726
- 数据集大小: 377011



