five

ImruQays/Quran-Classical-Arabic-English-Parallel-texts|古兰经翻译数据集|多语言文本数据集

收藏
hugging_face2023-12-29 更新2024-03-04 收录
古兰经翻译
多语言文本
下载链接:
https://hf-mirror.com/datasets/ImruQays/Quran-Classical-Arabic-English-Parallel-texts
下载链接
链接失效反馈
资源简介:
该数据集包含了《古兰经》的阿拉伯语文本(Imlaei和Uthmanic两种书写方式)以及17种不同的英语翻译版本。这些英语翻译并非《古兰经》本身,而是对《古兰经》文本意义的解释或翻译,旨在向不懂阿拉伯语的人传达其信息。数据集的任务类别为翻译,涉及的语言为阿拉伯语和英语,数据规模在10K到100K之间,使用的许可证为cc-by-nc-4.0。

该数据集包含了《古兰经》的阿拉伯语文本(Imlaei和Uthmanic两种书写方式)以及17种不同的英语翻译版本。这些英语翻译并非《古兰经》本身,而是对《古兰经》文本意义的解释或翻译,旨在向不懂阿拉伯语的人传达其信息。数据集的任务类别为翻译,涉及的语言为阿拉伯语和英语,数据规模在10K到100K之间,使用的许可证为cc-by-nc-4.0。
提供机构:
ImruQays
原始信息汇总

数据集概述

任务类别

  • 翻译

语言

  • 阿拉伯语
  • 英语

数据集规模

  • 10K<n<100K

许可

  • cc-by-nc-4.0

简介

该数据集包含《古兰经》的阿拉伯语(Imlaei & Uthmanic 字体)与17种不同英语翻译的平行文本。

内容

数据集包括古典阿拉伯语的《古兰经》及其以下英语翻译:

  • "al-Qur’ân: A Contemporary Translation" by Ahmed Ali
  • "Kanz-ul-Iman" by Ahmed Raza Khan
  • "The Koran Interpreted" by Arthur John Arberry
  • "The Message of The Quran" by Muhammad Asad
  • "Quran English Commentary" by Abdul Majid Daryabadi
  • "Noble Quran" by Muhammad Muhsin Khan and Muhammad Taqi-ud-Din al-Hilali
  • "Clear Quran" by Talal Itani
  • "Tafheem ul Quran" by Abul Ala Maududi
  • Translation by Safi-ur-Rahman al-Mubarakpuri
  • Translation by Mohammed Marmaduke William Pickthall
  • Translation by Ali Quli Qarai
  • Translation by Hasan al-Fatih Qaribullah and Ahmad Darwish
  • "Saheeh International"
  • "The Arabic Text and English Translation" by Muhammad Sarwar
  • "The Holy Quran" by M. H. Shakir (author disputed)
  • Translation by Wahiduddin Khan
  • "The Holy Quran: Text, Translation and Commentary" by Abdullah Yusuf Ali

关于英语翻译的说明

英语翻译不视为《古兰经》本身,《古兰经》仅以阿拉伯语存在。这些翻译旨在向不懂阿拉伯语的人传达《古兰经》的信息,提供宝贵见解但不能替代原始阿拉伯语文本,后者在伊斯兰传统中具有独特地位,被视为神的直接话语。

原始编译

该数据集的原始编译由 M-AI-C 完成,似乎源自 Tanzil

修改

添加了Imlaei字体并移除了tafseers。

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

LEGO数据集

该数据集包含了关于LEGO公司的历史、产品提供以及特定LEGO套装的信息,用于分析LEGO套装的规模、发布年份、主题分布以及套装复杂性的变化。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录