five

NELA-GT-2019

收藏
OpenDataLab2026-04-05 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NELA-GT-2019
下载链接
链接失效反馈
资源简介:
在本文中,我们展示了 NELA-GT-2018 数据集(N{\o}rregaard、Horne 和 Adal{\i} 2019)的更新版本,名为 NELA-GT-2019。 NELA-GT-2019 包含来自 2019 年 1 月 1 日至 2019 年 12 月 31 日期间收集的 260 个来源的 112 万篇新闻文章。与 NELA-GT-2018 一样,这些来源来自广泛的主流新闻来源和替代新闻来源。数据集中包含来自 7 个不同评估站点的源级地面实况标签,涵盖多个真实性维度。 NELA-GT-2019 数据集可在以下网址找到:https://doi.org/10.7910/DVN/O7FWPO

In this paper, we present an updated version of the NELA-GT-2018 dataset (Nørregaard, Horne, and Adalí 2019), named NELA-GT-2019. NELA-GT-2019 contains 1.12 million news articles from 260 sources collected between January 1, 2019 and December 31, 2019. Similar to NELA-GT-2018, these sources span a wide range of mainstream and alternative news outlets. The dataset includes source-level ground truth labels from 7 distinct evaluation sites, covering multiple dimensions of news veracity. The NELA-GT-2019 dataset is available at: https://doi.org/10.7910/DVN/O7FWPO
提供机构:
OpenDataLab
创建时间:
2022-05-23
AI搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NELA-GT-2019是一个新闻文章数据集,包含2019年全年从260个主流和替代新闻来源收集的112万篇文章,用于研究新闻真实性。该数据集提供了来自7个评估站点的源级地面实况标签,覆盖多个真实性维度,支持对新闻可信度的分析和评估。数据集由伦斯勒理工学院发布,遵循CC0 1.0许可,适用于新闻可信度研究相关任务。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作