FGraDA (Fine-Grained Domain Adaptation Dataset)

Name: FGraDA (Fine-Grained Domain Adaptation Dataset)
Creator: OpenDataLab
Published: 2026-05-24 06:30:15
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/FGraDA

下载链接

链接失效反馈

官方服务：

资源简介：

我们在机器翻译（FGraDA）中提出了一个现实世界的细粒度领域适应任务。 FGraDA 数据集包含四个信息技术子领域的中英翻译任务：自动驾驶汽车、人工智能教育、实时网络和智能手机。每个子域都配备了用于评估目的的开发集和测试集。为了更贴近实际，FGraDA没有使用任何域内双语训练数据，而是提供双语词典和wiki知识库，可以在短时间内更容易获得。

We propose a real-world fine-grained domain adaptation task for machine translation, termed FGraDA. The FGraDA dataset encompasses Chinese-English translation tasks across four information technology subfields: autonomous vehicles, AI education, real-time networks, and smartphones. Each subdomain is equipped with a development set and a test set for evaluation purposes. To better align with real-world scenarios, FGraDA does not provide any in-domain bilingual training data. Instead, it offers bilingual dictionaries and Wikipedia knowledge bases that can be easily obtained within a short time frame.

提供机构：

OpenDataLab

创建时间：

2022-06-07

搜集汇总

数据集介绍