universitytehran/ESPOSITO
收藏Hugging Face2024-03-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/universitytehran/ESPOSITO
下载链接
链接失效反馈官方服务:
资源简介:
Esposito数据集是一个用于机器翻译的英语-波斯语科学平行语料库。该数据集包含350万条科学领域的平行句子,并提供了一个手动验证的科学测试集,可作为未来研究的基线。数据集由Mersad Esalati、Mohammad Javad Dousti和Heshaam Faili整理,语言为英语和波斯语,许可证为CC BY-NC-SA 4.0。数据源来自科学信息数据库。
Esposito数据集是一个用于机器翻译的英语-波斯语科学平行语料库。该数据集包含350万条科学领域的平行句子,并提供了一个手动验证的科学测试集,可作为未来研究的基线。数据集由Mersad Esalati、Mohammad Javad Dousti和Heshaam Faili整理,语言为英语和波斯语,许可证为CC BY-NC-SA 4.0。数据源来自科学信息数据库。
提供机构:
universitytehran
原始信息汇总
Esposito: 英语-波斯语科学领域平行语料库
数据集概述
Esposito 包含350万条英语-波斯语科学领域的平行句子。此外,还提供了一个手动验证的科学测试集,可作为未来研究的基准。
数据集详情
数据集描述
- 联系人: Mersad Esalati
- 语言: 英语和波斯语
- 许可证: CC BY-NC-SA 4.0



