five

Newsela

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Newsela
下载链接
链接失效反馈
官方服务:
资源简介:
在过去的 5 年里,简单维基百科主导了简化研究。在这篇意见书中,我们认为专注于维基百科会限制简化研究。我们通过语料库分析和强调其他研究人员在简化文献中所做的陈述来支持我们的论点。我们引入了一个新的简化数据集,它是对简单维基百科的重大改进,并提出了一种新颖的定量比较方法来研究简化数据资源的质量。

Over the past five years, Simple English Wikipedia has dominated simplification research. In this opinion piece, we argue that focusing solely on Wikipedia limits simplification research. We support our argument through corpus analysis and by highlighting statements made by other researchers in simplification literature. We introduce a new simplification dataset that represents a significant improvement over Simple English Wikipedia, and propose a novel quantitative comparison method for studying the quality of simplification data resources.
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Newsela是一个文本简化数据集,旨在改进简单维基百科在文本简化研究中的局限性,提供更高质量的数据资源。该数据集支持定量比较方法,由宾夕法尼亚大学和约翰霍普金斯大学于2015年发布,主要用于促进文本简化领域的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作