five

maryantocinn/indosum

收藏
Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maryantocinn/indosum
下载链接
链接失效反馈
官方服务:
资源简介:
INDOSUM是一个用于印尼语文本摘要的新基准数据集。该数据集由新闻文章和手动构建的摘要组成。

INDOSUM是一个用于印尼语文本摘要的新基准数据集。该数据集由新闻文章和手动构建的摘要组成。
提供机构:
maryantocinn
原始信息汇总

indosum

INDOSUM 是一个新的印度尼西亚文本摘要基准数据集。

该数据集包含新闻文章和人工构建的摘要。

数据集使用

在通过 HuggingFace 的 load_dataset 加载数据集之前,请运行 pip install nusacrowd

引用

@INPROCEEDINGS{8629109, author={Kurniawan, Kemal and Louvan, Samuel}, booktitle={2018 International Conference on Asian Language Processing (IALP)}, title={Indosum: A New Benchmark Dataset for Indonesian Text Summarization}, year={2018}, volume={}, number={}, pages={215-220}, doi={10.1109/IALP.2018.8629109}}

许可证

Apache License, Version 2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作