five

atlasia/darija-translation

收藏
Hugging Face2024-04-25 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/atlasia/darija-translation
下载链接
链接失效反馈
官方服务:
资源简介:
AtlasIA Darija翻译数据集是一个开源项目,旨在收集Darija(摩洛哥阿拉伯语)与英语或法语之间的翻译数据。数据通过AtlasIA平台收集,用户可以将Darija句子翻译成英语或法语,并可选地提供音频录制和翻译置信度。数据集包含Darija句子、翻译文本、可选音频以及置信度信息,采用结构化格式存储。数据集发布在Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License下,支持研究和开源工作。
提供机构:
atlasia
原始信息汇总

数据集概述

数据集名称

AtlasIA Darija Translation

数据集目的

收集Darija-English翻译数据集,用于开放源代码项目。

数据集内容

  • 语言: 阿拉伯语(Darija)、英语、法语
  • 数据结构:
    • Darija句子
    • 英语或法语翻译
    • 可选音频录制
    • 翻译的信心水平

数据收集方式

通过用户友好的AtlasIA界面收集数据,包括翻译、音频录制和信心水平。

数据存储

  • 初始存储于Firestore DB
  • 处理后移至本仓库进行开源

贡献方式

  • 访问AtlasIA
  • 翻译句子并选择翻译语言(EN/FR)
  • 可选录制音频并提交
  • 报告错误句子

数据集许可证

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)

联系方式

可通过项目合作者或Discord社区联系。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作