Web Server Access Logs
收藏www.kaggle.com2021-02-13 更新2025-03-24 收录
下载链接:
https://www.kaggle.com/eliasdabbas/web-server-access-logs
下载链接
链接失效反馈官方服务:
资源简介:
### Context
Web sever logs contain information on any event that was registered/logged. This contains a lot of insights on website visitors, behavior, crawlers accessing the site, business insights, security issues, and more.
This is a dataset for trying to gain insights from such a file.
### Content
3.3GB of logs from an Iranian ecommerce website zanbil.ir.
### Acknowledgements
Zaker, Farzin, 2019, "Online Shopping Store - Web Server Logs", https://doi.org/10.7910/DVN/3QBYB5, Harvard Dataverse, V1
### Inspiration
Trying to create an efficient pipeline for reading, parsing, compressing, and analyzing web server log files.
### 背景说明
网络服务器日志记录了所有已注册/记录的事件信息。其中蕴含了关于网站访客、行为、访问网站的爬虫、商业洞察、安全问题等多方面的深刻见解。
本数据集旨在从此类文件中获取洞察。
### 内容概览
包含来自伊朗电子商务网站 zanbil.ir 的 3.3GB 日志数据。
### 致谢
Zaker, Farzin, 2019, "在线购物商店 - 网络服务器日志", https://doi.org/10.7910/DVN/3QBYB5, 哈佛数据平台,版本 V1
### 灵感来源
致力于构建一个高效的管道,用于读取、解析、压缩和分析网络服务器日志文件。
提供机构:
www.kaggle.com
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含3.3GB来自伊朗电商网站zanbil.ir的Nginx服务器访问日志,记录了网站访问者行为、爬虫活动等丰富信息,适用于网站分析和安全研究。数据集采用CC0公共领域许可证,由哈佛Dataverse发布,且不会更新。
以上内容由遇见数据集搜集并总结生成



