Assignment_1_EDA
收藏Hugging Face2026-04-02 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/Yoel125/Assignment_1_EDA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为“多模型交易数据”,包含比特币(BTC)的历史交易数据,旨在研究比特币价格变动与关键技术指标(如成交量、RSI、MACD和Stoch RSI)之间的直接关系。数据集规模为7.26K行和18列,核心特征包括价格动态(开盘价、最高价、最低价、收盘价)、性能指标(成交量、收益率)和技术指标(RSI、Stoch RSI、MACD)。数据清洗过程中保留了异常值,以反映比特币市场中的高波动性时期。研究问题聚焦于技术指标如何反映比特币价格变动,发现RSI能有效识别超买和超卖水平,Stochastic RSI对短期价格反转更敏感,而MACD通过交叉确认趋势。该数据集适用于金融市场分析、技术指标研究和加密货币价格预测等任务。
创建时间:
2026-04-01
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称: Bitcoin (BTC) Price Action & Technical Indicators Analysis
- 数据集地址: https://huggingface.co/datasets/Yoel125/Assignment_1_EDA
- 数据来源: 基于数据集 "Multi-Model Trading Data" (来源: https://huggingface.co/datasets/AdityaaXD/Multi-Model-Trading-Data)
- 数据规模: 7.26K 行,18 列
数据内容与特征
- 核心特征:
- 价格动态:
open,high,low,close - 性能指标:
volume,returns - 技术指标:
RSI(动量),stoch_rsi_d(敏感性),MACD(趋势确认) - 时间线:
date
- 价格动态:
- 数据清洗与处理:
- 策略性筛选出10个核心列。
- 使用四分位距 (IQR) 检测价格异常值。
- 选择保留异常值,因其代表重要的市场转变和高波动期。
研究目标与发现
- 主要研究问题: 技术指标 (
Volume,RSI,MACD,Stoch RSI) 在多大程度上反映了比特币的价格变动? - 关键发现:
- 价格异常值并非随机噪声,而是与主要的历史价格涨跌事件同时出现,表明价格变动遵循结构性波动模式。
- 成交量和价格回报之间存在弱线性关系,成交量本身并不决定价格方向。
RSI有效识别价格变动中的“超买”和“超卖”水平。Stochastic RSI作为RSI的高度敏感版本,为短期价格反转提供更快信号。MACD通过交叉提供趋势确认,通常与显著的价格突破保持一致。
- 最终结论: 比特币的价格变动与动量转换和趋势确认(如
MACD和RSI所示)的相关性,比与简单的交易量峰值相关性更密切。
项目文件
| 文件 | 描述 | 链接 |
|---|---|---|
_Assigment_1_EDA.csv |
清洗后的BTC数据集 | https://huggingface.co/datasets/Yoel125/Assignment_1_EDA/blob/main/_Assigment_1_EDA.csv |
_Assignment_1_EDA_&_Dataset_5.ipynb |
完整分析笔记本 | https://huggingface.co/datasets/Yoel125/Assignment_1_EDA/blob/main/Assignment_1_EDA%26_Dataset_5.ipynb |
搜集汇总
数据集介绍

构建方式
在金融时间序列分析领域,Assignment_1_EDA数据集源于对原始多模型交易数据的深度处理。其构建过程始于从公开源获取比特币历史交易数据,随后通过策略性筛选,聚焦于开盘价、最高价、最低价、收盘价、成交量、收益率以及RSI、随机RSI和MACD等核心技术指标共十个关键字段。数据清洗环节采用了基于四分位距的异常值检测方法,但鉴于加密货币市场高波动性的本质,极端价格点被审慎保留,视作反映重大市场结构性转变的关键信息,而非噪声,从而确保了数据在表征市场真实动力学行为方面的完整性。
特点
该数据集的核心特征体现在其精心设计的结构与内容上。它包含了约7.26K行记录,覆盖了比特币价格动态、市场表现度量及关键技术指标,形成了一个多维度的金融时间序列分析框架。尤为突出的是,数据集明确保留了通过统计方法识别出的价格异常值,这些异常值在时间轴上呈现集群分布,与历史上的重大价格涨跌事件同步,为研究市场波动模式与极端行情下的指标响应提供了不可多得的实证材料。这种对原始市场特征的忠实保留,使得数据集特别适用于探索价格运动与技术指标信号之间的复杂关联。
使用方法
在量化金融与市场分析的研究实践中,该数据集为探索技术指标的有效性提供了直接的数据基础。研究者可首先利用其进行探索性数据分析,可视化价格与指标序列以识别基本模式。进而,通过相关性分析、回归建模等方法,定量检验成交量、RSI、MACD及随机RSI等指标与价格变动或收益率之间的关联强度与性质。数据集附带的完整分析笔记详细展示了从数据清洗到洞察获取的全流程,为用户提供了可复现的分析范例,特别适合于验证市场动量、趋势反转信号以及在高波动时期指标行为的假设。
背景与挑战
背景概述
在金融时间序列分析领域,加密货币市场因其高波动性和非线性特征,为量化研究提供了独特场景。Assignment_1_EDA数据集源于一项针对比特币价格行为与关键技术指标关联性的探索性研究,其核心旨在解析动量指标与趋势确认工具如何捕捉市场动态。该数据集整合了比特币历史交易数据,涵盖开盘价、收盘价、成交量及相对强弱指数(RSI)、移动平均收敛散度(MACD)等衍生指标,通过系统化数据清洗与异常值保留策略,保留了市场极端波动事件,为理解加密货币价格形成机制提供了实证基础。
当前挑战
该数据集致力于应对加密货币价格预测中技术指标有效性的验证挑战,即如何从高噪声市场数据中提取稳健信号以识别趋势反转与动量转换。在构建过程中,研究面临多重挑战:首先,金融时间序列固有的非平稳性与异方差性要求复杂的预处理方法;其次,异常值处理需平衡数据清洁度与市场真实性,因极端价格波动本身承载关键信息;此外,多技术指标间的共线性与滞后效应增加了特征选择的复杂性,需通过严谨的统计检验避免过拟合。
常用场景
经典使用场景
在金融时间序列分析领域,Assignment_1_EDA数据集为研究者提供了比特币历史交易数据与关键技术指标的整合视图。该数据集最经典的使用场景在于探索加密货币市场中价格动态与动量指标之间的关联性,通过可视化与统计方法揭示价格异常、趋势反转及市场波动模式。研究人员常利用其进行探索性数据分析,以识别RSI、MACD等指标在预测价格走势中的有效性,从而构建基于技术分析的市场行为模型。
实际应用
在实际应用层面,Assignment_1_EDA数据集服务于加密货币交易策略的开发与风险管理。交易员与算法工程师利用其清洗后的数据回测技术指标的有效性,优化买入卖出信号生成系统。金融机构则借助该数据集分析市场极端波动期间的指标反应,从而设计对冲策略或评估投资组合风险。此外,教育机构也将其作为金融数据分析课程的实践材料,培养学生处理高频金融数据与进行市场诊断的能力。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在加密货币预测模型与波动性研究领域。许多后续研究基于其提供的技术指标扩展了机器学习应用,例如利用LSTM或Transformer架构融合多指标特征进行价格预测。同时,该数据集也激发了关于市场异常检测与聚类分析的研究,学者们通过其价格异常模式探讨波动传染效应与市场结构性断裂,进一步推动了金融时间序列分析方法的创新与发展。
以上内容由遇见数据集搜集并总结生成



