five

swiss-ai/romansh_data

收藏
Hugging Face2025-08-06 更新2025-08-09 收录
下载链接:
https://hf-mirror.com/datasets/swiss-ai/romansh_data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个部分:罗马什语单语数据、罗马什语到德语、法语、意大利语或英语的翻译数据(对齐和非对齐),以及合成数据。合成数据是通过交织翻译数据并在句子前加上“这是从源语言翻译成罗马什语的文本”而创建的。数据集中包含来自不同地区的法律文本和公告,双语文本库,在线词典以及罗马什语的维基网站内容。

This dataset consists of three parts: Monolingual Romansh data, translated data from Romansh into German, French, Italian, or English (aligned and non-aligned), and synthetic data. The synthetic data is created by interweaving the translational data and prefacing it with the sentence This is a text translated from SOURCE LANGUAGE to Rumantsch Grischun. The dataset includes law texts and announcements from different regions, a bilingual corpus, online dictionaries, and Romansh Wikipedia content.
提供机构:
swiss-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作