Multilingual Lexical Simplification Benchmark Dataset

Name: Multilingual Lexical Simplification Benchmark Dataset
Creator: LaSTUS Lab, TALN Group, Universitat Pompeu Fabra, Barcelona, Spain
Published: 2022-09-12 23:06:26
License: 暂无描述

arXiv2022-09-12 更新2024-06-21 收录

下载链接：

https://github.com/LaSTUS-TALN-UPF/TSAR-2022-Shared-Task

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集是由西班牙巴塞罗那的Universitat Pompeu Fabra大学LaSTUS实验室TALN小组创建的多语言词汇简化基准数据集，包含1153条实例，覆盖英语、西班牙语和葡萄牙语。数据集旨在为构建和评估词汇简化系统提供高质量的评估资源，特别适用于多语言环境下的系统比较。数据集通过GitHub平台公开，支持研究者进行系统性能的公平比较和进一步的研究开发。

This multilingual lexical simplification benchmark dataset was created by the TALN Group of the LaSTUS Laboratory at Universitat Pompeu Fabra in Barcelona, Spain. It comprises 1,153 instances covering English, Spanish and Portuguese. The dataset is designed to provide high-quality evaluation resources for the development and assessment of lexical simplification systems, and is particularly suitable for system comparison in multilingual environments. The dataset is publicly available via the GitHub platform, enabling researchers to conduct fair performance comparisons of systems and carry out further research and development.

提供机构：

LaSTUS Lab, TALN Group, Universitat Pompeu Fabra, Barcelona, Spain

创建时间：

2022-09-12

5,000+

优质数据集

54 个

任务类型

进入经典数据集