five

Multilingual Lexical Simplification Benchmark Dataset

收藏
arXiv2022-09-12 更新2024-06-21 收录
下载链接:
https://github.com/LaSTUS-TALN-UPF/TSAR-2022-Shared-Task
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是由西班牙巴塞罗那的Universitat Pompeu Fabra大学LaSTUS实验室TALN小组创建的多语言词汇简化基准数据集,包含1153条实例,覆盖英语、西班牙语和葡萄牙语。数据集旨在为构建和评估词汇简化系统提供高质量的评估资源,特别适用于多语言环境下的系统比较。数据集通过GitHub平台公开,支持研究者进行系统性能的公平比较和进一步的研究开发。

This multilingual lexical simplification benchmark dataset was created by the TALN Group of the LaSTUS Laboratory at Universitat Pompeu Fabra in Barcelona, Spain. It comprises 1,153 instances covering English, Spanish and Portuguese. The dataset is designed to provide high-quality evaluation resources for the development and assessment of lexical simplification systems, and is particularly suitable for system comparison in multilingual environments. The dataset is publicly available via the GitHub platform, enabling researchers to conduct fair performance comparisons of systems and carry out further research and development.
提供机构:
LaSTUS Lab, TALN Group, Universitat Pompeu Fabra, Barcelona, Spain
创建时间:
2022-09-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作