GuoFeng Webnovel Corpus
收藏arXiv2025-09-30 收录
下载链接:
http://www2.statmt.org/wmt23/literary-translation-task.html
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一份版权受保护的文档级中英网络小说语料库,专为2023年WMT的Discourse-Level文学翻译共享任务而发布。该数据集旨在用于将中文文学文本翻译成英文,同时适用于自动评估和人工评估指标,以促进文学文本的机器翻译研究。
This dataset is a copyright-protected document-level Chinese-English web novel corpus, specifically released for the 2023 WMT Discourse-Level Literary Translation Shared Task. It is designed for translating Chinese literary texts into English, and is also applicable to both automatic and manual evaluation metrics to facilitate machine translation research on literary works.
提供机构:
Tencent AI Lab and China Literature Ltd.
搜集汇总
数据集介绍

背景与挑战
背景概述
GuoFeng Webnovel Corpus是一个用于文学文本机器翻译的中英双语数据集,包含179本网络小说的22,567个连续章节,覆盖14种文学类型。数据集经过严格的对齐和版权管理,适用于非商业研究用途。
以上内容由遇见数据集搜集并总结生成



