Alpha Vantage Stock Market Data|股票市场数据集|时间序列数据数据集
收藏数据集概述
数据集来源
- 来源: Alpha Vantage API
- 详细信息: 时间序列每日股票数据,涵盖选定的公司。
数据集结构
- 表名:
RAW_DATA.LAB2
- 列:
symbol
: 股票代码(例如,NFLX, ISRG)date
: 记录日期close
: 当日的收盘价
数据处理流程
- 数据提取: 从Alpha Vantage API获取股票数据。
- ETL处理: 使用Airflow将数据加载到Snowflake的
RAW_DATA.LAB2
表中。 - ELT处理: 使用dbt对原始数据进行转换,计算关键指标(如7天移动平均、相对强弱指数RSI、价格动量)。
- 数据可视化: 使用Tableau、Superset或Preset工具展示分析结果。
关键指标
- 7天移动平均
- 相对强弱指数 (RSI)
- 价格动量
数据集用途
- 用例: 股票价格分析,用于分析公司(如ISRG, NFLX)的趋势、动量和表现。

Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录