Kaggle: Web Traffic Time Series Forecasting|时间序列预测数据集|网页流量分析数据集
收藏
- Kaggle首次发布Web Traffic Time Series Forecasting数据集,旨在通过机器学习模型预测维基百科页面的未来访问量。
- 该数据集在Kaggle平台上引发广泛关注,成为时间序列预测领域的研究热点,吸引了众多数据科学家和研究者参与竞赛。
- 基于该数据集的研究成果开始在学术会议和期刊上发表,推动了时间序列预测算法的发展和应用。
- 该数据集被用于多个教育机构的教学案例,帮助学生理解和应用时间序列分析技术。
- 随着深度学习技术的进步,该数据集成为验证新型时间序列预测模型性能的重要基准。
- 1The Web Traffic Forecasting Competition on Kaggle: A RetrospectiveKaggle · 2018年
- 2A Hybrid Model for Web Traffic Time Series ForecastingIEEE · 2019年
- 3DeepAR: Probabilistic Forecasting with Autoregressive Recurrent NetworksAmazon · 2017年
- 4Temporal Fusion Transformers for Interpretable Multi-horizon Time Series ForecastingGoogle · 2019年
- 5Long Short-Term Memory Networks for Anomaly Detection in Time SeriesUniversity of Leuven · 2015年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
Online Retail II
该在线零售II数据集包含了一家英国注册的非实体店铺在线零售商在2009年12月1日至2011年12月9日期间发生的所有交易记录。该公司主要销售各种场合的独特礼品。该公司的许多客户是批发商。
github 收录