five

ZurichNLP/SwissGov-RSD

收藏
Hugging Face2026-03-04 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/ZurichNLP/SwissGov-RSD
下载链接
链接失效反馈
官方服务:
资源简介:
SwissGov-RSD是一个自然、人工标注的文档级跨语言数据集,用于标记级别的语义差异识别(RSD)。它包含224个多语言并行的瑞士政府文档,语言对包括英语-德语、英语-法语和英语-意大利语,标注了细粒度的语义差异标签(0-1)在标记级别。数据集针对现实世界中的跨语言内容差异场景,如翻译错误、异步更新或显式化。

SwissGov-RSD is the a naturalistic, human-annotated, document-level, cross-lingual dataset for token-level semantic difference recognition (RSD). It contains 224 multi-parallel Swiss government documents from [admin.ch](admin.ch) in English–German, English–French, and English–Italian, annotated with fine-grained semantic difference labels (0–1) at the token level. The dataset targets real-world scenarios where cross-lingual content diverges due to translation errors, asynchronous updates, or explicitations.
提供机构:
ZurichNLP
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作