five

mteb/IWSLT2017BitextMining

收藏
Hugging Face2025-05-04 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/mteb/IWSLT2017BitextMining
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个语言对的句子对,每个语言对都有一个验证集,验证集中包含句子对的数量和字节大小。数据集的特征包括两个句子(sentence1和sentence2),数据类型为字符串。数据集涵盖了阿拉伯语、德语、英语、法语、意大利语、日语、韩语、荷兰语、罗马尼亚语和中文等多种语言之间的句子对。

This dataset contains sentence pairs for multiple language pairs, each with a validation set that includes the number of sentence pairs and their byte size. The features of the dataset include two sentences (sentence1 and sentence2) with a data type of string. The dataset covers sentence pairs between languages such as Arabic, German, English, French, Italian, Japanese, Korean, Dutch, Romanian, and Chinese.
提供机构:
mteb
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作