five

minhthong/flashdeal_data_NKG_historical_signal

收藏
Hugging Face2024-07-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/minhthong/flashdeal_data_NKG_historical_signal
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如时间戳、买卖信号(买入、卖出、做空、平仓等)、技术指标(如10日、30日、50日移动平均线,15日波动率,14日相对强弱指数)以及一个名为Tín hiệu的字符串特征。数据集分为一个训练集,包含127个样本,总大小为13987字节。

该数据集包含多个特征,如时间戳、买卖信号(买入、卖出、做空、平仓等)、技术指标(如10日、30日、50日移动平均线,15日波动率,14日相对强弱指数)以及一个名为Tín hiệu的字符串特征。数据集分为一个训练集,包含127个样本,总大小为13987字节。
提供机构:
minhthong
原始信息汇总

数据集概述

数据集信息

特征

  • time: 时间戳,数据类型为 timestamp[ns]
  • Buy: 整数类型,数据类型为 int64
  • BottomFishing: 整数类型,数据类型为 int64
  • Sell: 整数类型,数据类型为 int64
  • Short: 整数类型,数据类型为 int64
  • Cover: 整数类型,数据类型为 int64
  • Sideway: 整数类型,数据类型为 int64
  • MA10: 浮点数类型,数据类型为 float64
  • MA30: 浮点数类型,数据类型为 float64
  • MA50: 浮点数类型,数据类型为 float64
  • MA15V: 浮点数类型,数据类型为 float64
  • RSI14: 浮点数类型,数据类型为 float64
  • Tín hiệu: 字符串类型,数据类型为 string
  • index_level_0: 时间戳,数据类型为 timestamp[ns]

数据分割

  • train: 训练集,包含 127 个样本,占用 13987 字节

数据集大小

  • 下载大小: 12593 字节
  • 数据集大小: 13987 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在金融时序分析领域,交易信号的准确提取与历史模式的挖掘是量化策略构建的核心环节。该数据集基于越南股票市场的历史交易数据,通过整合价格与成交量信息,构建了包含时间戳、买卖信号、底部捕捞信号、空头信号及平仓信号等多元标签的结构化数据。技术指标如MA10、MA30、MA50均线、MA15V成交量均线及RSI14相对强弱指标被系统计算并纳入特征空间。数据采集与预处理遵循严格的时间对齐规则,确保每个时间点上的信号与指标具有同步性与一致性,最终形成127条训练样本的紧凑数据集。
使用方法
该数据集主要面向时序预测与交易信号分类任务。使用时可通过Hugging Face Datasets库加载,默认配置以训练集形式提供。建议将‘Tín hiệu’标签列作为预测目标,利用历史技术指标进行监督学习建模。数据按时间顺序排列,可直接应用于LSTM、Transformer等序列模型,或通过特征工程扩展为监督学习格式。对于回测场景,需注意时间戳索引的连续性,避免未来信息泄露。数据规模较小,适合作为概念验证或教学数据集,亦可作为更大规模金融数据集的特征设计参考。
背景与挑战
背景概述
在金融时间序列分析领域,历史信号数据对于量化交易策略的构建与回测具有基石性作用。由研究者minhthong创建的flashdeal_data_NKG_historical_signal数据集,聚焦于股票市场的多空信号与趋势指标,收录了127个时间节点的交易信号记录。该数据集涵盖买入、卖出、做空、平仓等核心操作信号,以及移动平均线(MA10/30/50)、相对强弱指数(RSI14)等经典技术分析指标,为研究市场微观结构中的信号有效性提供了结构化样本。作为面向越南NKG股票的历史信号数据集,其诞生填补了东南亚新兴市场高频信号数据的空白,为验证技术指标在特定市场环境下的预测能力创造了条件。
当前挑战
该数据集面临的核心挑战在于样本量有限(仅127条记录),可能难以支撑复杂机器学习模型的训练与泛化。技术指标维度的选择虽具代表性,但缺乏成交量、波动率等辅助指标,导致信号生成逻辑的完整性受限。从构建过程看,时间戳精度与信号标注标准未明确说明,可能存在因数据源差异导致的信号不一致问题。此外,数据集仅包含训练集划分,缺少验证与测试基准,这为模型过拟合风险的评估与跨时间段的稳健性检验设置了障碍。
常用场景
经典使用场景
该数据集旨在为金融时间序列分析与量化交易策略研究提供基础信号数据支撑。通过整合买卖信号、抄底与平仓指令、震荡状态以及移动平均与相对强弱指数等经典技术指标,研究者可基于历史信号构建多因子模型或事件驱动型交易系统,用于回测不同市场环境下的策略表现。
解决学术问题
该数据集有效解决了金融时间序列中信号标注稀疏性与特征维度不统一的问题,为验证技术分析指标在趋势识别与反转预测中的有效性提供了标准化基准。它支持学者探究移动平均线与RSI等经典工具在噪声市场中的组合预测能力,推动了对市场微观结构异常现象的系统性量化研究。
实际应用
在实际量化投资领域,该数据集可被用于开发自动化交易代理的信号决策模块,辅助机构投资者实时识别买入、卖出或观望时机。其整合的多维技术指标还能用于构建风险预警系统,帮助交易员在震荡市中规避错误开仓,提升策略的鲁棒性与收益稳定性。
数据集最近研究
最新研究方向
该数据集聚焦于越南股市(NKG股票)的历史交易信号分析,融合了技术指标(如移动平均线MA10/30/50、RSI14、成交量均线MA15V)与多空行为标签(买入、卖出、底钓、做空、回补、横盘),为量化交易策略的优化提供了高时间粒度的标注数据。当前前沿研究方向集中于利用此类多维度信号数据集训练深度学习模型(如LSTM或Transformer),以捕捉市场微观结构中的非线性模式,进而提升短期价格预测的准确性与稳健性。该数据集的出现填补了东南亚新兴市场高频交易信号标注数据的空白,对于理解越南市场在全球化资本流动下的价格发现机制具有重要实践价值,尤其为跨市场套利策略的风险控制与信号融合研究提供了可靠基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作