MCTS 中文文本简化数据集
收藏超神经2025-03-06 更新2024-12-28 收录
下载链接:
https://hyper.ai/cn/datasets/36770
下载链接
链接失效反馈官方服务:
资源简介:
MCTS 全称为 Multi-Reference Chinese Text Simplification Dataset,是由北京语言大学、东北大学和清华大学的研究团队于 2024 年发布的中文文本简化数据集,相关论文成果为「MCTS: A Multi-Reference Chinese Text Simplification Dataset」,旨在为自然语言处理领域中的文本简化任务提供丰富的资源和支持。
MCTS stands for Multi-Reference Chinese Text Simplification Dataset. It is a Chinese text simplification dataset released in 2024 by a research team from Beijing Language and Culture University, Northeastern University and Tsinghua University. The associated research paper is titled "MCTS: A Multi-Reference Chinese Text Simplification Dataset", and it aims to provide rich resources and support for the text simplification task in the field of natural language processing.
创建时间:
2024-12-27
搜集汇总
数据集介绍

背景与挑战
背景概述
MCTS(多参考中文文本简化数据集)是由北京语言大学、东北大学和清华大学于2024年发布的中文文本简化资源,包含723条基于新闻语料的复杂句子及其多个人工简化版本,是中文文本简化任务中规模最大、参考最多的评估数据集。它定义了改述、压缩和结构转换三种改写方法,适用于分级阅读和机器翻译等研究,并提供训练数据及自动评估指标支持。
以上内容由遇见数据集搜集并总结生成



