atlasia/darija-translation
收藏Hugging Face2024-04-25 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/atlasia/darija-translation
下载链接
链接失效反馈官方服务:
资源简介:
AtlasIA Darija翻译数据集是一个开源项目,旨在收集Darija(摩洛哥阿拉伯语)与英语或法语之间的翻译数据。数据通过AtlasIA平台收集,用户可以将Darija句子翻译成英语或法语,并可选地提供音频录制和翻译置信度。数据集包含Darija句子、翻译文本、可选音频以及置信度信息,采用结构化格式存储。数据集发布在Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License下,支持研究和开源工作。
提供机构:
atlasia
原始信息汇总
数据集概述
数据集名称
AtlasIA Darija Translation
数据集目的
收集Darija-English翻译数据集,用于开放源代码项目。
数据集内容
- 语言: 阿拉伯语(Darija)、英语、法语
- 数据结构:
- Darija句子
- 英语或法语翻译
- 可选音频录制
- 翻译的信心水平
数据收集方式
通过用户友好的AtlasIA界面收集数据,包括翻译、音频录制和信心水平。
数据存储
- 初始存储于Firestore DB
- 处理后移至本仓库进行开源
贡献方式
- 访问AtlasIA
- 翻译句子并选择翻译语言(EN/FR)
- 可选录制音频并提交
- 报告错误句子
数据集许可证
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)
联系方式
可通过项目合作者或Discord社区联系。



