yahoo-finance-data|金融数据数据集|财务分析数据集
收藏Yahoo Finance 金融数据集
数据集概述
该数据集包含从 Yahoo! Finance、Nasdaq 和美国财政部通过公开 API 获取的金融数据,主要用于研究和教育目的。数据集定期更新,每次更新都会发布一个新的版本,版本格式为 dt=yyyy-mm-dd
,其中 yyyy-mm-dd
表示最新数据的日期。
数据集列表
1. stock_profile
- 来源:
https://finance.yahoo.com/quote/{$symbol}/profile/
- 描述: 包含公司详细信息,如地址、行业和员工数量。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 address VARCHAR 公司地址 city VARCHAR 城市 country VARCHAR 国家 phone VARCHAR 电话号码 zip VARCHAR 邮政编码 industry VARCHAR 行业类型 sector VARCHAR 业务部门 long_business_summary VARCHAR 业务摘要 full_time_employees INTEGER 全职员工数量 report_date VARCHAR 数据报告日期
2. stock_officers
- 来源:
https://finance.yahoo.com/quote/{$symbol}/profile/
- 描述: 列出公司高管,包括他们的薪酬和职位。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 name VARCHAR 高管姓名 title VARCHAR 高管职位 age INTEGER 高管年龄 born INTEGER 出生年份 pay INTEGER 薪酬(美元) exercised INTEGER 行使的股票期权 unexercised INTEGER 未行使的股票期权
3. stock_summary
- 来源:
https://finance.yahoo.com/quote/${symbol}/key-statistics/
- 描述: 提供财务指标,如市值、市盈率(P/E)和每股收益(EPS)。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 market_cap DECIMAL(38,2) 市值(美元) enterprise_value DECIMAL(38,2) 企业价值(美元) shares_outstanding DECIMAL(38,2) 流通股数量 beta DECIMAL(38,2) 贝塔值 trailing_pe DECIMAL(38,2) 市盈率(TTM) forward_pe DECIMAL(38,2) 市盈率(前瞻) tailing_eps DECIMAL(38,2) 每股收益(TTM) forward_eps DECIMAL(38,2) 每股收益(前瞻) enterprise_to_ebitda DECIMAL(38,2) 企业价值/EBITDA enterprise_to_revenue DECIMAL(38,2) 企业价值/收入 peg_ratio DECIMAL(38,2) PEG比率 currency VARCHAR 货币(如美元)
4. stock_tailing_eps
- 来源:
https://ycharts.com/companies/${symbol}/eps_ttm
- 描述: 提供财务指标,如每股收益(TTM EPS)。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 tailing_eps DECIMAL(38,2) 每股收益(TTM) update_time VARCHAR 最后更新时间
5. stock_earning_calendar
- 来源:
https://www.nasdaq.com/market-activity/earnings
- 描述: 包含公司财报信息,包括股票代码、报告日期、公司名称和财政季度结束日期。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 name VARCHAR 公司名称 fiscal_quarter_ending VARCHAR 财政季度结束日期
6. stock_historical_eps
- 来源:
https://finance.yahoo.com/quote/${symbol}/analysis/#Earnings History
- 描述: 包含公司历史财报数据,包括股票代码、实际和预计的每股收益、意外百分比和对应的财政季度。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 eps_actual VARCHAR 实际每股收益 eps_estimate VARCHAR 预计每股收益 surprise_percent VARCHAR 意外百分比 quarter_name VARCHAR 财政季度名称 quarter_date VARCHAR 财政季度结束日期
7. stock_statement
- 来源:
https://finance.yahoo.com/quote/${symbol}/financials/
- 描述: 包含公司财务报表详细信息,包括股票代码、报告日期、特定财务项目及其值、相关报表类型和期间。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 item_name VARCHAR 财务报表项目名称 item_value DECIMAL(38,2) 财务报表项目值 finance_type VARCHAR 财务报表类型 period_type VARCHAR 报告期间类型
8. stock_prices
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含历史股票市场数据,包括股票代码、报告日期和关键交易指标,如开盘价、收盘价、最高价、最低价和交易量。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 交易日期 open DECIMAL(38,2) 开盘价 close DECIMAL(38,2) 收盘价 high DECIMAL(38,2) 最高价 low DECIMAL(38,2) 最低价 volume BIGINT 交易量
9. stock_dividend_events
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含股息数据,包括股票代码、报告日期和股息值。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 amount DECIMAL(38,2) 股息金额
10. stock_split_events
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含股票拆分数据,包括股票代码、报告日期和拆分因子。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 split_factor VARCHAR 拆分因子
11. exchange_rate
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含报告日期的货币汇率数据,包括开盘价、收盘价、最高价和最低价。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 open DECIMAL(38,2) 开盘价 close DECIMAL(38,2) 收盘价 high DECIMAL(38,2) 最高价 low DECIMAL(38,2) 最低价
12. daily_treasury_yield
- 来源:
https://home.treasury.gov/
- 描述: 包含每日国债收益率数据,包括不同时间段的收益率(月度和年度)。
- 列:
列名 列类型 描述 report_date VARCHAR 报告日期 bc1_month DECIMAL(38,2) 1个月国债收益率 bc2_month DECIMAL(38,2) 2个月国债收益率 bc3_month DECIMAL(38,2) 3个月国债收益率 bc6_month DECIMAL(38,2) 6个月国债收益率 bc1_year DECIMAL(38,2) 1年国债收益率 bc2_year DECIMAL(38,2) 2年国债收益率 bc3_year DECIMAL(38,2) 3年国债收益率 bc5_year DECIMAL(38,2) 5年国债收益率 bc7_year DECIMAL(38,2) 7年国债收益率 bc10_year DECIMAL(38,2) 10年国债收益率 bc30_year DECIMAL(38,2) 30年国债收益率
数据使用说明
数据集可通过 DuckDB 进行查询,所有数据集均为公开访问,并以 Parquet 文件格式存储。

中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录