five

Local News Social Media Dataset

收藏
github2024-03-29 更新2024-05-31 收录
下载链接:
https://github.com/sTechLab/local-news-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国10,257个地方新闻机构的详细信息及其社交媒体账号,包括地理位置、Facebook和Twitter账号等。数据集还提供了用于分析新闻内容和社交媒体互动的指标,如人口覆盖率和内容网络邻居。

This dataset encompasses detailed information and social media accounts of 10,257 local news organizations across the United States, including geographical locations, Facebook, and Twitter accounts. Additionally, the dataset provides metrics for analyzing news content and social media interactions, such as population coverage and content network neighbors.
创建时间:
2022-04-04
原始信息汇总

数据集概述

数据集名称

Local News Social Media Dataset

数据集内容

  • 包含10,257个美国地方新闻机构的详细信息及其社交媒体账号。
  • 数据集映射了7,859个新闻机构的地理位置和县,9,231个新闻机构的Facebook账号,以及5,645个新闻机构的Twitter账号。
  • 提供了Twitter和Facebook账号的ID,便于通过CrowdTangle API和Twitter API V2获取内容。
  • 使用FIPS县代码,便于获取县级别的数据,如人口普查数据或选民记录。

数据集构造方法

  • 通过扩展一个种子目录的地方新闻机构,并利用Facebook的“相关页面”功能构建。

数据集指标

  • 人口覆盖:衡量新闻机构的地方性或全国性,基于Twitter受众地理位置数据和州密度进行标准化处理。
  • 内容网络邻居:衡量一个新闻机构与其他新闻机构共享内容的数量,识别属于更大网络的新闻机构。

数据集字段说明

字段 描述 唯一值数量
OutletId 数据集中本地新闻机构的唯一ID(0至10256) 10257
Name 本地新闻机构的名称 10257
WebsiteUrl 本地新闻机构的网站URL 9935
State 美国邮政服务(USPS)州代码,非美国位置标记为“non-US”,未找到位置标记为“NA” 8648
City 新闻机构所在城市的名称,非美国位置标记为“non-US”,未找到位置标记为“NA” 8648
StateId 2位联邦信息处理标准(FIPS)州代码 7859
CountyId 3位FIPS县代码 7859
CountyFIPS 5位FIPS代码,包含StateId和CountyId 7859
TwitterId Twitter账号的唯一标识符 5645
TwitterHandle Twitter用户名,可能更改 5645
TwitterFollowersCount Twitter粉丝数,截至TwitterRetrievedDate 5645
TwitterDescription Twitter账号描述 5323
TwitterRetrievedDate Twitter字段检索日期(2020-10-19至2022-05-24) 5645
FacebookId Facebook账号的唯一标识符,CrowdTangle API中的platformId 9231
FacebookSubscriberCount Facebook粉丝数 9231
FacebookCategories Facebook页面类别,如报纸、新闻媒体网站等 6900
FacebookPageDescription Facebook页面描述 9189
FacebookAdditionalInfo Facebook页面附加信息 4082
FacebookRetrievedDate Facebook字段检索日期(2020-09-29至2020-10-19) 9231
PopulationReach 基于Twitter受众地理位置的覆盖度量,有Twitter账号时可用 2780
ContentNetworkNeighbors 基于Facebook共享内容的网络邻居数量,有Facebook页面时可用 8751

数据集用途

  • 分析美国地方新闻机构的大规模内容。
  • 鼓励研究者利用Twitter和Facebook的API获取地方新闻社交媒体内容。
搜集汇总
数据集介绍
main_image_url
构建方式
Local News Social Media Dataset的构建基于美国地方新闻媒体的广泛收集与映射。研究者通过扩展一个初始的地方新闻媒体目录,并利用Facebook的“相关页面”功能,逐步完善数据集。该数据集共包含10,257家新闻媒体,其中7,859家被映射到具体的地理位置和县区,9,231家拥有Facebook账号,5,645家拥有Twitter账号。此外,数据集还通过Twitter和Facebook API提供了这些账号的内容检索功能,并结合FIPS县区代码,便于用户获取县区级别的数据。
使用方法
该数据集的使用方法主要围绕社交媒体内容的获取与分析展开。研究者可以通过Twitter API V2和Facebook的CrowdTangle API,利用数据集提供的账号ID检索相关社交媒体内容。FIPS县区代码的引入使得用户能够轻松获取县区级别的数据,如人口普查或选民记录。此外,数据集中的*人口覆盖范围*和*内容网络邻居*指标可用于分析地方新闻媒体的受众特征和网络结构。研究者可以结合这些数据,开展大规模的地方新闻媒体内容与影响力研究。
背景与挑战
背景概述
Local News Social Media Dataset 是由 Marianne Aubin Le Quéré 等研究人员于2022年创建的一个专注于美国地方新闻媒体及其社交媒体账号的数据集。该数据集涵盖了10,257家地方新闻媒体,其中7,859家被映射到具体的地理位置和县区,9,231家拥有Facebook账号,5,645家拥有Twitter账号。通过结合Facebook的CrowdTangle API和Twitter API V2,研究人员能够获取这些媒体的社交媒体内容。该数据集的构建基于对地方新闻媒体目录的扩展,并利用Facebook的“相关页面”功能进行补充。其核心研究问题在于大规模分析地方新闻媒体的社交媒体内容及其在COVID-19疫情期间的覆盖与互动情况。该数据集为研究地方新闻媒体的传播模式、受众覆盖范围及其在社交媒体上的影响力提供了重要的数据支持。
当前挑战
Local News Social Media Dataset 在构建过程中面临了多方面的挑战。首先,地方新闻媒体的分布广泛且数量庞大,如何确保数据集的全面性和代表性是一个关键问题。尽管数据集覆盖了约60%的美国地方新闻媒体,但仍存在部分媒体未被收录的情况。其次,社交媒体数据的动态性和不稳定性为数据采集带来了困难,例如Twitter账号的用户名可能随时更改,Facebook页面的信息也可能更新。此外,数据集的验证过程需要依赖复杂的算法和人工审核,以确保数据的准确性和一致性。最后,如何有效利用Facebook和Twitter的API获取社交媒体内容,并处理大规模数据的存储与分析,也是技术上的重要挑战。
常用场景
经典使用场景
Local News Social Media Dataset 为研究者提供了一个全面的美国地方新闻媒体社交媒体数据资源,涵盖了超过10,000家新闻机构的社交媒体账号信息。该数据集最经典的使用场景在于大规模分析地方新闻媒体的社交媒体内容,尤其是在研究新闻传播、受众互动以及信息扩散模式时,研究者可以通过该数据集获取新闻机构的Facebook和Twitter账号内容,并结合地理位置信息进行深入分析。
解决学术问题
该数据集解决了地方新闻媒体研究中的多个关键问题,例如如何量化新闻机构的影响力、如何分析新闻内容的传播网络以及如何评估新闻机构的地域覆盖范围。通过提供Facebook和Twitter账号的唯一标识符,研究者可以借助API获取详细的社交媒体数据,从而进行大规模的内容分析和受众研究。此外,数据集中的FIPS县代码使得研究者能够轻松地将新闻数据与县级人口普查数据或选民记录相结合,进一步拓展了研究的深度和广度。
实际应用
在实际应用中,Local News Social Media Dataset 为新闻机构、政策制定者和市场研究人员提供了宝贵的资源。新闻机构可以通过分析社交媒体数据优化内容策略,提升受众参与度;政策制定者可以利用该数据集评估地方新闻媒体的覆盖范围和影响力,从而制定更有效的媒体政策;市场研究人员则可以通过分析新闻内容的传播网络,识别关键的信息传播节点,为品牌推广和舆情监控提供支持。
数据集最近研究
最新研究方向
在新闻传播与社交媒体研究领域,Local News Social Media Dataset为大规模分析美国地方新闻媒体的社交媒体内容提供了重要资源。该数据集不仅涵盖了超过10,000家地方新闻媒体及其社交媒体账号信息,还通过Facebook的“相关页面”功能扩展了数据覆盖范围,预计覆盖了美国约60%的地方新闻媒体。近年来,研究者利用该数据集深入探讨了地方新闻媒体在COVID-19疫情期间的报道模式与公众互动行为,揭示了社交媒体在信息传播中的关键作用。此外,数据集中的“人口覆盖范围”和“内容网络邻居”指标为分析新闻媒体的地域影响力及其在网络中的协作关系提供了新的视角。这些研究不仅推动了新闻传播学的发展,也为政策制定者和媒体从业者提供了宝贵的参考依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作