five

finnich/a-share-prices

收藏
Hugging Face2026-03-04 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/finnich/a-share-prices
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit size_categories: - 10M<n<100M configs: - config_name: main_data data_files: - split: train path: all-prices.csv --- # Dataset Card for a-share-prices ## Dataset Summary This is a daily candlestick dataset of A-share 主板 market, covering the period Since January 1, 2005. It is primarily intended for historical market data research and does not guarantee the frequency of updates for new data. You can see the latest updated date in the file `.last_update_date`. It consists in two files all-prices.csv and calendar.csv. - all-prices.csv is the primary data file(Attention: the prices are `不复权价`). - calendar.csv is the extra file if you need to list the trade calendar. You can load it with: ``` from datasets import load_dataset demo1 = load_dataset("ellendan/a-share-prices", data_files="all-prices.csv") ``` Or manually download and save the csv files to local. ## Dataset columns **The all-prices.csv file:** - code,股票的代码 - date,行情发生的日期。 - open,开盘价。 - low,最低价。 - high,最高价。 - close,收盘价。 - prev_close,前一日收盘价。 - quote_rate,涨跌幅(单位:%)。 - volume,成交量(单位:手)。 - turnover,成交额(单位:千元)。 - high_limit,当日涨停的限价。 - low_limit,当日跌停的限价。 - turnover_rate,换手率(单位:%)。 - turnover_rate_f, 自由流通换手率(单位:%)。 - volume_ratio,量比。 - pe,市盈率(总市值/净利润, 亏损的PE为空)。 - pe_ttm,市盈率(TTM,亏损的PE为空)。 - pb,市净率(总市值/净资产)。 - ps,市销率。 - ps_ttm,市销率(TTM)。 - dv_ratio,股息率 (%)。 - dv_ttm,股息率(TTM)(%)。 - total_share,总股本 (万股)。 - float_share,流通股本 (万股)。 - free_share,自由流通股本 (万股)。 - total_mv,总市值 (万元)。 - circ_mv,流通市值(万元)。 - name,股票中文名。 - area,地域。 - industry,所属行业。 - market,市场类型(主板/创业板/科创板/CDR)。 - exchange,交易所代码(SSE上交所 SZSE深交所 BSE北交所)。 - list_date,上市日期。 因为切换了数据源,曾经旧的字段 `is_st` 和 `avg_price` 不再提供。 `is_paused`字段,是否停牌 —— 数据集内都是“未停牌”的记录。 **注意:** 从2025年4月5日开始,`all-prices.csv`会增量更新,因此获取数据集后请手动排序(源csv文件不再保持 date 列的先后顺序)。

许可证:MIT协议 数据规模分类:1000万条 < 数据量 < 1亿条 配置项: - 配置名称:主数据集 数据文件: - 拆分方式:训练集 文件路径:all-prices.csv # 「A股行情数据集」数据集卡片 ## 数据集概览 本数据集为A股主板市场的日线K线行情数据集,覆盖时段自2005年1月1日起。 本数据集主要用于历史行情数据研究,不保证新增数据的更新频率。您可在`.last_update_date`文件中查看最新更新日期。 本数据集包含两个文件:`all-prices.csv`与`calendar.csv`: - `all-prices.csv` 为核心数据文件(注意:此处行情价格为**不复权价格**)。 - `calendar.csv` 为辅助文件,用于获取交易日历。 您可通过以下方式加载数据集: from datasets import load_dataset demo1 = load_dataset("ellendan/a-share-prices", data_files="all-prices.csv") 或手动下载CSV文件至本地存储。 ## 数据集字段说明 **`all-prices.csv` 文件字段如下:** - `code`:股票代码 - `date`:行情发生日期 - `open`:开盘价 - `low`:最低价 - `high`:最高价 - `close`:收盘价 - `prev_close`:前一日收盘价 - `quote_rate`:涨跌幅(单位:%) - `volume`:成交量(单位:手) - `turnover`:成交额(单位:千元) - `high_limit`:当日涨停限价 - `low_limit`:当日跌停限价 - `turnover_rate`:换手率(单位:%) - `turnover_rate_f`:自由流通换手率(单位:%) - `volume_ratio`:量比 - `pe`:市盈率(总市值/净利润,亏损企业对应字段为空) - `pe_ttm`:滚动市盈率(TTM,亏损企业对应字段为空) - `pb`:市净率(总市值/净资产) - `ps`:市销率 - `ps_ttm`:滚动市销率(TTM) - `dv_ratio`:股息率(%) - `dv_ttm`:滚动股息率(TTM,%) - `total_share`:总股本(万股) - `float_share`:流通股本(万股) - `free_share`:自由流通股本(万股) - `total_mv`:总市值(万元) - `circ_mv`:流通市值(万元) - `name`:股票中文名称 - `area`:股票所属地域 - `industry`:所属行业 - `market`:市场类型(主板/创业板/科创板/CDR) - `exchange`:交易所代码(SSE:上海证券交易所,SZSE:深圳证券交易所,BSE:北京证券交易所) - `list_date`:上市日期 因数据源切换,原有的`is_st`与`avg_price`字段已不再提供。 `is_paused`字段为停牌标记——本数据集所有记录均为「未停牌」状态。 **注意:** 自2025年4月5日起,`all-prices.csv`将采用增量更新模式,因此获取数据集后请手动对数据进行排序(源CSV文件将不再保留`date`列的时序顺序)。
提供机构:
finnich
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作