five

universitytehran/ESPOSITO

收藏
Hugging Face2024-03-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/universitytehran/ESPOSITO
下载链接
链接失效反馈
官方服务:
资源简介:
Esposito数据集是一个用于机器翻译的英语-波斯语科学平行语料库。该数据集包含350万条科学领域的平行句子,并提供了一个手动验证的科学测试集,可作为未来研究的基线。数据集由Mersad Esalati、Mohammad Javad Dousti和Heshaam Faili整理,语言为英语和波斯语,许可证为CC BY-NC-SA 4.0。数据源来自科学信息数据库。

Esposito数据集是一个用于机器翻译的英语-波斯语科学平行语料库。该数据集包含350万条科学领域的平行句子,并提供了一个手动验证的科学测试集,可作为未来研究的基线。数据集由Mersad Esalati、Mohammad Javad Dousti和Heshaam Faili整理,语言为英语和波斯语,许可证为CC BY-NC-SA 4.0。数据源来自科学信息数据库。
提供机构:
universitytehran
原始信息汇总

Esposito: 英语-波斯语科学领域平行语料库

数据集概述

Esposito 包含350万条英语-波斯语科学领域的平行句子。此外,还提供了一个手动验证的科学测试集,可作为未来研究的基准。

数据集详情

数据集描述

数据集来源

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作