3Sources
收藏arXiv2025-09-30 收录
下载链接:
http://mlg.ucd.ie/datasets/3sources.html
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个基准的多视角文档数据集,它从BBC、路透社和卫报这3个在线新闻来源收集而成。每个来源被视为一个视角,共有69个样本被随机分配用于分类任务。该数据集的规模为169个样本,分为3个视角,所面临的任务是文档分类。
This dataset is a benchmark multi-view document dataset collected from three online news outlets: BBC, Reuters, and The Guardian. Each source is treated as a distinct view, and a total of 69 samples are randomly assigned for the document classification task. The full dataset contains 169 samples across 3 views, with the core task being document classification.
搜集汇总
数据集介绍

背景与挑战
背景概述
3Sources数据集是一个多视角新闻文本数据集,包含来自三个主要新闻来源的948篇文章,覆盖416个故事,标注了六个主题。数据集已预处理,适用于非商业和研究用途。
以上内容由遇见数据集搜集并总结生成



