five

Web Server Access Logs

收藏
www.kaggle.com2021-02-13 更新2025-03-24 收录
下载链接:
https://www.kaggle.com/eliasdabbas/web-server-access-logs
下载链接
链接失效反馈
官方服务:
资源简介:
### Context Web sever logs contain information on any event that was registered/logged. This contains a lot of insights on website visitors, behavior, crawlers accessing the site, business insights, security issues, and more. This is a dataset for trying to gain insights from such a file. ### Content 3.3GB of logs from an Iranian ecommerce website zanbil.ir. ### Acknowledgements Zaker, Farzin, 2019, "Online Shopping Store - Web Server Logs", https://doi.org/10.7910/DVN/3QBYB5, Harvard Dataverse, V1 ### Inspiration Trying to create an efficient pipeline for reading, parsing, compressing, and analyzing web server log files.

### 背景说明 网络服务器日志记录了所有已注册/记录的事件信息。其中蕴含了关于网站访客、行为、访问网站的爬虫、商业洞察、安全问题等多方面的深刻见解。 本数据集旨在从此类文件中获取洞察。 ### 内容概览 包含来自伊朗电子商务网站 zanbil.ir 的 3.3GB 日志数据。 ### 致谢 Zaker, Farzin, 2019, "在线购物商店 - 网络服务器日志", https://doi.org/10.7910/DVN/3QBYB5, 哈佛数据平台,版本 V1 ### 灵感来源 致力于构建一个高效的管道,用于读取、解析、压缩和分析网络服务器日志文件。
提供机构:
www.kaggle.com
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含3.3GB来自伊朗电商网站zanbil.ir的Nginx服务器访问日志,记录了网站访问者行为、爬虫活动等丰富信息,适用于网站分析和安全研究。数据集采用CC0公共领域许可证,由哈佛Dataverse发布,且不会更新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作