five

SIMPITIKI corpus for simplification in Italian

收藏
NIAID Data Ecosystem2026-03-11 收录
下载链接:
https://zenodo.org/record/2535626
下载链接
链接失效反馈
官方服务:
资源简介:
SIMPITIKI is a Simplification corpus for Italian and it consists of two sets of simplified pairs: the first one is harvested from the Italian Wikipedia in a semi-automatic way; the second one is manually annotated sentence-by-sentence from documents in the administrative domain. For more details, see https://github.com/dhfbk/simpitiki

SIMPITIKI是一款面向意大利语的简化语料库(Simplification Corpus),其共包含两组简化句对集:第一组以半自动化方式从意大利维基百科(Italian Wikipedia)中采集得到;第二组源自行政领域文档,并对其中句子逐句完成人工标注。 如需了解更多细节,请访问:https://github.com/dhfbk/simpitiki
创建时间:
2020-01-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作