Newsela
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Newsela
下载链接
链接失效反馈官方服务:
资源简介:
在过去的 5 年里,简单维基百科主导了简化研究。在这篇意见书中,我们认为专注于维基百科会限制简化研究。我们通过语料库分析和强调其他研究人员在简化文献中所做的陈述来支持我们的论点。我们引入了一个新的简化数据集,它是对简单维基百科的重大改进,并提出了一种新颖的定量比较方法来研究简化数据资源的质量。
Over the past five years, Simple English Wikipedia has dominated simplification research. In this opinion piece, we argue that focusing solely on Wikipedia limits simplification research. We support our argument through corpus analysis and by highlighting statements made by other researchers in simplification literature. We introduce a new simplification dataset that represents a significant improvement over Simple English Wikipedia, and propose a novel quantitative comparison method for studying the quality of simplification data resources.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
Newsela是一个文本简化数据集,旨在改进简单维基百科在文本简化研究中的局限性,提供更高质量的数据资源。该数据集支持定量比较方法,由宾夕法尼亚大学和约翰霍普金斯大学于2015年发布,主要用于促进文本简化领域的研究。
以上内容由遇见数据集搜集并总结生成



