atlasia/darija_english
收藏Hugging Face2024-05-16 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/atlasia/darija_english
下载链接
链接失效反馈官方服务:
资源简介:
由AtlasIA编译的Darija-English对数据集。该数据集包含摩洛哥Darija和英语的句子对,适用于翻译任务。数据集来源包括AtlasIA平台贡献、混合阿拉伯数据集和AtlasIA x DODa项目,后者可用于音译任务。
由AtlasIA编译的Darija-English对数据集。该数据集包含摩洛哥Darija和英语的句子对,适用于翻译任务。数据集来源包括AtlasIA平台贡献、混合阿拉伯数据集和AtlasIA x DODa项目,后者可用于音译任务。
提供机构:
atlasia
原始信息汇总
数据集概述
基本信息
- 名称: atlasia/darija-english
- 语言: 摩洛哥达里加语, 英语
- 许可证: CC-by-NC-4.0
- 数据集大小: 100K<n<1M
数据集内容
- 数据文件配置:
- config_name: web_data
- 数据文件: atlasia_web_data.csv
- config_name: comments
- 数据文件: atlasia_comments.csv
- config_name: stories
- 数据文件: atlasia_stories.csv
- config_name: doda
- 数据文件: atlasia_doda.csv
- config_name: transliteration
- 数据文件: atlasia_atam.csv
- config_name: web_data
数据集来源
- 达里加语句子的来源:
- doda: AtlasIA平台贡献
- stories: 混合阿拉伯语数据集
- transliteration: AtlasIA x DODa



