five

fhswf/latin-german-parallel

收藏
Hugging Face2025-12-15 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/fhswf/latin-german-parallel
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含406,011个拉丁语-德语的平行句子对。每个条目包含一个拉丁语句子及其对应的德语翻译,以及来源、标签和分数。标签表示句子的历史时期(如ANCIENT、MEDIEVAL、MODERN或UNKNOWN),分数表示对齐质量(-1表示手动对齐,≥1表示自动对齐,分数越高对齐质量越好)。数据集适用于机器翻译任务,并提供了过滤高质量对齐句子的方法。

This dataset consists of 406,011 Latin-German parallel sentences (sentence pairs). Each entry contains a Latin sentence and its corresponding German translation, along with the source, tag, and score. The tag indicates the historical period of the sentence (e.g., ANCIENT, MEDIEVAL, MODERN, or UNKNOWN), and the score indicates the alignment quality (-1 for manual alignment, ≥1 for automated alignment, with higher scores indicating better quality). The dataset is suitable for machine translation tasks and includes methods for filtering high-quality alignments.
提供机构:
fhswf
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作