five

匿名Microsoft Web数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-25940.html
下载链接
链接失效反馈
官方服务:
资源简介:
Data Set Information: 我们通过对www.microsoft.com日志进行采样和处理来创建数据。数据记录了38000名匿名、随机选择的用户使用www.microsoft.com的情况。对于每个用户,数据列出了用户在一周时间内访问的网站(Vroots)的所有区域。 用户仅通过序列号识别,例如用户#14988、用户#14989等。该文件不包含任何个人可识别信息。294个VRoot通过其标题(如“NetShow for PowerPoint”)和URL(如“/stream”)进行标识。数据来自1998年2月的一周。 Attribute Information: 每个属性都是www.microsoft.com网站的一个区域(“vroot”)。 数据集记录了1998年2月每个用户在一周的时间内访问的VROOT。 Relevant Papers: J. Breese, D. Heckerman., C. Kadie _Empirical Analysis of Predictive Algorithms for Collaborative Filtering_ Proceedings of the Fourteenth Conference on Uncertainty in Artificial Intelligence, Madison, WI, July, 1998. [Web link] Also, expanded as Microsoft Research Technical Report MSR-TR-98-12, The papers are available on-line at: [Web link] Papers That Cite This Data Set1: W. Nick Street and Yoo-Hyon Kim. A streaming ensemble algorithm (SEA) for large-scale classification. KDD. 2001. [View Context]. Dmitry Pavlov and Darya Chudova and Padhraic Smyth. Towards scalable support vector machines using squashing. KDD. 2000. [View Context]. Dmitry Pavlov and Jianchang Mao and Byron Dom. Scaling-Up Support Vector Machines Using Boosting Algorithm. ICPR. 2000. [View Context]. Kristin P. Bennett and Erin J. Bredensteiner. Geometry in Learning. Department of Mathematical Sciences Rensselaer Polytechnic Institute. [View Context]. Citation Request: Please refer to the Machine Learning Repository's citation policy
提供机构:
帕依提提
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作