five

Digg_2009 social news votes and graph

收藏
DataCite Commons2020-09-04 更新2024-07-25 收录
下载链接:
https://figshare.com/articles/dataset/Digg_2009_social_news_votes_and_graph/2062467
下载链接
链接失效反馈
官方服务:
资源简介:
Digg2009 data set contains data about stories promoted to Digg's front page over a period of a month in 2009. For each story, we collected the list of all Digg users who have voted for the story up to the time of data collection, and the time stamp of each vote. We also retrieved the voters' friendship links. The semantics of the friendship links are as follows <br>user_id --&gt; friend_id <br><br>means that user_id is watching the activities of (is a fan of) friend_id. User ids have been anonymized, but are unique in the data set: a user with a specific id in the friendship links table and a user with the same id in the votes table correspond to the same actual user.The data is in zipped csv files that are password protected. The password is <i>digg2009_user</i>.VotesTable <b>digg_votes</b> contains 3,018,197 votes on 3553 popular stories made by 139,409 distinct users. The first vote is from the story's submitter. <br>Schema of the tablevote_date: Unix time stamp of the votevoter_id: anonymized unique id of the voterstory_id: anonymized unique id of the storyFriendship linksTable <b>digg_friends</b> contains 1,731,658 friendship links of 71,367 distinct users. Voters who do not appear in the table did not specify any friends at the time data was collected.<br>Schema of the digg_friends tablemutual: indicated whether the link represents a mutual friend relation (1) or not (0)friend_date: Unix time stamp of when the friendship link was createduser_id: anonymized unique id of a userfriend_id: anonymized unique id of a userThis data is made available to the community for research purposes only. If you use the data in a publication, please cite: <br>Hogg, T. and Lerman, K. (2012) Social Dynamics of Digg. <i>EPJ Data Science</i>1(5). doi:10.1140/epjds5

Digg2009数据集收录了2009年一个月内被推送至Digg首页的所有投稿帖子的相关数据。针对每一篇帖子,我们收集了截至数据采集时点为该帖子投票的全部Digg用户列表,以及每一次投票的时间戳。我们还获取了这些投票用户的好友关联关系。好友关联关系的语义如下:<br>user_id → friend_id<br>表示user_id关注(即成为其粉丝)friend_id的动态。用户ID已完成匿名化处理,但在数据集内保持唯一:好友关系表中特定ID的用户与投票表中同一ID的用户,对应现实中的同一真实用户。 本数据集以加密压缩的CSV文件形式提供,解压密码为`digg2009_user`。 投票表`digg_votes`共包含139,409名独立用户对3,553条热门帖子发起的3,018,197次投票,其中首次投票由帖子的提交者完成。该表的字段定义如下: - vote_date:投票的Unix时间戳 - voter_id:投票用户的匿名化唯一标识 - story_id:投稿帖子的匿名化唯一标识 好友关系表`digg_friends`共包含71,367名独立用户的1,731,658条好友关联记录。未出现在该表中的投票用户,在数据采集时点未设置任何好友关系。该表的字段定义如下: - mutual:标识该关联是否为双向好友关系(1表示是,0表示否) - friend_date:好友关系创建时的Unix时间戳 - user_id:某一用户的匿名化唯一标识 - friend_id:好友用户的匿名化唯一标识 本数据集仅面向学术研究目的向社区开放。若将该数据用于学术出版物,请引用以下文献:<br>Hogg, T. 与 Lerman, K. (2012) 《Digg的社交动态》,《EPJ数据科学》1(5)。DOI:10.1140/epjds5
提供机构:
figshare
创建时间:
2016-01-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Digg_2009数据集包含2009年Digg社交新闻网站上一个月内3553个热门故事的投票数据(3,018,197条)和71,367个用户间的友谊链接数据(1,731,658条)。所有数据经过匿名化处理,用户ID唯一,数据以密码保护的csv文件形式提供,适用于社交网络动态研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作