yahoo-finance-data|金融数据数据集|财务分析数据集
收藏Yahoo Finance 金融数据集
数据集概述
该数据集包含从 Yahoo! Finance、Nasdaq 和美国财政部通过公开 API 获取的金融数据,主要用于研究和教育目的。数据集定期更新,每次更新都会发布一个新的版本,版本格式为 dt=yyyy-mm-dd
,其中 yyyy-mm-dd
表示最新数据的日期。
数据集列表
1. stock_profile
- 来源:
https://finance.yahoo.com/quote/{$symbol}/profile/
- 描述: 包含公司详细信息,如地址、行业和员工数量。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 address VARCHAR 公司地址 city VARCHAR 城市 country VARCHAR 国家 phone VARCHAR 电话号码 zip VARCHAR 邮政编码 industry VARCHAR 行业类型 sector VARCHAR 业务部门 long_business_summary VARCHAR 业务摘要 full_time_employees INTEGER 全职员工数量 report_date VARCHAR 数据报告日期
2. stock_officers
- 来源:
https://finance.yahoo.com/quote/{$symbol}/profile/
- 描述: 列出公司高管,包括他们的薪酬和职位。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 name VARCHAR 高管姓名 title VARCHAR 高管职位 age INTEGER 高管年龄 born INTEGER 出生年份 pay INTEGER 薪酬(美元) exercised INTEGER 行使的股票期权 unexercised INTEGER 未行使的股票期权
3. stock_summary
- 来源:
https://finance.yahoo.com/quote/${symbol}/key-statistics/
- 描述: 提供财务指标,如市值、市盈率(P/E)和每股收益(EPS)。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 market_cap DECIMAL(38,2) 市值(美元) enterprise_value DECIMAL(38,2) 企业价值(美元) shares_outstanding DECIMAL(38,2) 流通股数量 beta DECIMAL(38,2) 贝塔值 trailing_pe DECIMAL(38,2) 市盈率(TTM) forward_pe DECIMAL(38,2) 市盈率(前瞻) tailing_eps DECIMAL(38,2) 每股收益(TTM) forward_eps DECIMAL(38,2) 每股收益(前瞻) enterprise_to_ebitda DECIMAL(38,2) 企业价值/EBITDA enterprise_to_revenue DECIMAL(38,2) 企业价值/收入 peg_ratio DECIMAL(38,2) PEG比率 currency VARCHAR 货币(如美元)
4. stock_tailing_eps
- 来源:
https://ycharts.com/companies/${symbol}/eps_ttm
- 描述: 提供财务指标,如每股收益(TTM EPS)。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 tailing_eps DECIMAL(38,2) 每股收益(TTM) update_time VARCHAR 最后更新时间
5. stock_earning_calendar
- 来源:
https://www.nasdaq.com/market-activity/earnings
- 描述: 包含公司财报信息,包括股票代码、报告日期、公司名称和财政季度结束日期。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 name VARCHAR 公司名称 fiscal_quarter_ending VARCHAR 财政季度结束日期
6. stock_historical_eps
- 来源:
https://finance.yahoo.com/quote/${symbol}/analysis/#Earnings History
- 描述: 包含公司历史财报数据,包括股票代码、实际和预计的每股收益、意外百分比和对应的财政季度。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 eps_actual VARCHAR 实际每股收益 eps_estimate VARCHAR 预计每股收益 surprise_percent VARCHAR 意外百分比 quarter_name VARCHAR 财政季度名称 quarter_date VARCHAR 财政季度结束日期
7. stock_statement
- 来源:
https://finance.yahoo.com/quote/${symbol}/financials/
- 描述: 包含公司财务报表详细信息,包括股票代码、报告日期、特定财务项目及其值、相关报表类型和期间。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 item_name VARCHAR 财务报表项目名称 item_value DECIMAL(38,2) 财务报表项目值 finance_type VARCHAR 财务报表类型 period_type VARCHAR 报告期间类型
8. stock_prices
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含历史股票市场数据,包括股票代码、报告日期和关键交易指标,如开盘价、收盘价、最高价、最低价和交易量。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 交易日期 open DECIMAL(38,2) 开盘价 close DECIMAL(38,2) 收盘价 high DECIMAL(38,2) 最高价 low DECIMAL(38,2) 最低价 volume BIGINT 交易量
9. stock_dividend_events
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含股息数据,包括股票代码、报告日期和股息值。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 amount DECIMAL(38,2) 股息金额
10. stock_split_events
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含股票拆分数据,包括股票代码、报告日期和拆分因子。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 split_factor VARCHAR 拆分因子
11. exchange_rate
- 来源:
https://finance.yahoo.com/quote/${symbol}/chart
- 描述: 包含报告日期的货币汇率数据,包括开盘价、收盘价、最高价和最低价。
- 列:
列名 列类型 描述 symbol VARCHAR 股票代码 report_date VARCHAR 报告日期 open DECIMAL(38,2) 开盘价 close DECIMAL(38,2) 收盘价 high DECIMAL(38,2) 最高价 low DECIMAL(38,2) 最低价
12. daily_treasury_yield
- 来源:
https://home.treasury.gov/
- 描述: 包含每日国债收益率数据,包括不同时间段的收益率(月度和年度)。
- 列:
列名 列类型 描述 report_date VARCHAR 报告日期 bc1_month DECIMAL(38,2) 1个月国债收益率 bc2_month DECIMAL(38,2) 2个月国债收益率 bc3_month DECIMAL(38,2) 3个月国债收益率 bc6_month DECIMAL(38,2) 6个月国债收益率 bc1_year DECIMAL(38,2) 1年国债收益率 bc2_year DECIMAL(38,2) 2年国债收益率 bc3_year DECIMAL(38,2) 3年国债收益率 bc5_year DECIMAL(38,2) 5年国债收益率 bc7_year DECIMAL(38,2) 7年国债收益率 bc10_year DECIMAL(38,2) 10年国债收益率 bc30_year DECIMAL(38,2) 30年国债收益率
数据使用说明
数据集可通过 DuckDB 进行查询,所有数据集均为公开访问,并以 Parquet 文件格式存储。

中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
全国 1∶200 000 数字地质图(公开版)空间数据库
As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.
DataCite Commons 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录