five

silvia-casola/WITS

收藏
Hugging Face2022-08-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/silvia-casola/WITS
下载链接
链接失效反馈
官方服务:
资源简介:
WITS(Wikipedia for Italian Text Summarization)是一个用于意大利语摘要生成的大规模数据集,基于维基百科文章的结构构建。该数据集包含近70万篇维基百科文章及其人工编写的摘要。与现有的意大利语摘要数据集相比,WITS规模更大且更具挑战性,因为其源文本较长。数据集语言为意大利语。
提供机构:
silvia-casola
原始信息汇总

数据集概述:WITS

数据集描述

数据集总结

WITS(Wikipedia for Italian Text Summarization)是一个大规模的意大利语摘要数据集,利用维基百科文章的结构构建。该数据集包含近700,000篇维基百科文章及其人工编写的摘要。与现有的意大利语文本摘要数据相比,WITS的规模更大,且由于其较长的源文本,更具挑战性。

语言

该数据集为意大利语。

附加信息

许可信息

数据集使用维基百科的文本,请参考维基百科的许可。

引用信息

如使用该数据集,请引用以下信息:

@inproceedings{DBLP:conf/clic-it/CasolaL21, author={Silvia Casola and Alberto Lavelli}, title={WITS: Wikipedia for Italian Text Summarization}, year={2021}, cdate={1609459200000}, url={http://ceur-ws.org/Vol-3033/paper65.pdf}, booktitle={CLiC-it}, crossref={conf/clic-it/2021} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作