O4B (Open4Business)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/O4B
下载链接
链接失效反馈官方服务:
资源简介:
Open4Business(O4B),一个包含 17,458 篇开放获取商业文章及其参考摘要的数据集。该数据集为业务领域的摘要带来了新的挑战,与其他现有数据集相比,需要高度抽象和更简洁的摘要。此外,我们评估了现有模型,因此表明在 O4B 和 7 倍大的非开放访问数据集上训练的模型在摘要方面取得了相当的性能。我们发布了数据集以及可用于类似地为多个域收集数据的代码。
Open4Business (O4B) is a dataset containing 17,458 open-access business articles and their reference summaries. This dataset introduces novel challenges for business-domain text summarization, as it requires highly abstractive and more concise summaries compared to other existing datasets. Furthermore, we evaluated existing models, demonstrating that models trained on both O4B and a non-open-access dataset seven times larger achieve comparable performance in summarization. We have released the dataset along with the code that can be used to collect data across multiple domains in a similar manner.
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍

背景与挑战
背景概述
O4B (Open4Business) 是一个发布于2020年的数据集,包含17,458篇开放获取商业文章及其参考摘要,由石溪大学发布。该数据集为商业领域摘要提出了新的挑战,要求摘要具有高度抽象性和简洁性,且基于该数据集训练的模型在性能上可与更大规模的非开放访问数据集相媲美。
以上内容由遇见数据集搜集并总结生成



