five

Bitcoin Dataset|比特币交易数据集|市场分析数据集

收藏
github2023-04-06 更新2024-05-31 收录
比特币交易
市场分析
下载链接:
https://github.com/umutbozkurt/bitcoin-dataset
下载链接
链接失效反馈
资源简介:
该数据集收集了比特币市场的详细交易数据,包括时间戳、价格、交易量、买卖类型、最高和最低价格等,用于分析比特币市场的动态。

This dataset compiles detailed transaction data from the Bitcoin market, encompassing timestamps, prices, trading volumes, types of buy and sell orders, as well as the highest and lowest prices, aimed at analyzing the dynamics of the Bitcoin market.
创建时间:
2016-02-17
原始信息汇总

Bitcoin Dataset 概述

数据收集内容

  • 时间戳
  • 价格
  • 交易量
  • 交易类型(卖出或买入)
  • 最高20个出价
  • 最高20个要价
  • 日最高价
  • 日最低价
  • 日交易量
  • 日加权平均价格

数据存储

  • 收集的数据初始存储于 Postgres
  • 数据收集完成后,将迁移至 InfluxDB 以利用其优秀的时间序列查询能力。

数据集可用性

  • 数据集预计在收集4-5个月的数据后,于 6月 提供。

技术细节

  • 数据收集依赖于 Bitstamp 作为数据源。
  • 数据集的收集通过运行 python dataset/collector.py 实现。

贡献

  • 新增数据源或值得收集的数字货币。
  • 文档修正或修复错误等。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Bitcoin数据集通过Bitstamp平台作为数据源,实时收集市场交易数据。数据采集过程涵盖了时间戳、价格、交易量、交易类型(买入或卖出)、前20个买卖报价、每日最高价、每日最低价、每日交易量以及每日成交量加权平均价等关键信息。数据存储于Postgres数据库中,并在采集完成后迁移至InfluxDB,以便更好地支持时间序列查询。
特点
该数据集以其全面性和实时性著称,涵盖了比特币市场的多维度交易数据。通过记录每笔交易的详细信息,数据集不仅提供了市场价格的动态变化,还捕捉了买卖双方的深度信息。此外,数据集还包含了每日的市场概览数据,如最高价、最低价和成交量加权平均价,为研究市场趋势和交易行为提供了丰富的基础。
使用方法
用户可通过克隆GitHub仓库并配置环境来使用该数据集。首先,需安装Postgres数据库和Python依赖包,并设置`secret.env`文件以配置数据库连接。随后,运行`python dataset/collector.py`脚本即可开始数据采集,日志文件将自动生成于同一目录下。数据集预计在采集4-5个月后发布,用户可通过InfluxDB进行高效的时间序列分析。
背景与挑战
背景概述
Bitcoin Dataset 是一个专注于比特币市场交易数据的开源数据集,由 Bitsamp 提供数据源,涵盖了时间戳、价格、交易量、买卖类型、前20个买卖订单、每日最高价、每日最低价、每日交易量及每日加权平均价格等关键信息。该数据集由 Umut Bozkurt 等研究人员于2017年创建,旨在为加密货币市场的研究提供高质量的时间序列数据。其数据存储于 Postgres 数据库,并计划迁移至 InfluxDB 以支持更高效的时间序列查询。该数据集为金融科技、区块链技术及加密货币市场分析等领域的研究提供了重要支持,推动了相关领域的定量分析与模型构建。
当前挑战
Bitcoin Dataset 的构建与应用面临多重挑战。首先,加密货币市场的高度波动性和数据复杂性使得数据采集与清洗过程异常困难,尤其是在处理高频交易数据时,如何确保数据的准确性与一致性成为关键问题。其次,数据集的构建依赖于外部数据源(如 Bitsamp),其数据接口的稳定性与访问限制可能影响数据的连续性与完整性。此外,由于加密货币市场的匿名性与去中心化特性,数据验证与真实性评估也面临较大挑战。最后,如何高效存储与查询大规模时间序列数据,以及如何设计适用于加密货币市场的分析模型,也是该数据集应用中的核心难题。
常用场景
经典使用场景
Bitcoin Dataset 主要用于加密货币市场的研究和分析,特别是在比特币交易行为的模式识别和价格预测方面。该数据集通过收集包括时间戳、价格、交易量、买卖类型等关键交易数据,为研究者提供了丰富的市场动态信息。这些数据不仅有助于理解比特币市场的微观结构,还能用于构建复杂的交易算法和风险评估模型。
衍生相关工作
基于 Bitcoin Dataset,许多经典的研究工作得以展开。例如,研究者开发了基于机器学习的价格预测模型,利用该数据集进行训练和验证。此外,还有研究利用这些数据分析了比特币市场的流动性和波动性,提出了新的市场效率指标。这些工作不仅推动了加密货币领域的研究进展,还为金融市场的其他领域提供了新的研究视角和方法。
数据集最近研究
最新研究方向
在数字货币领域,Bitcoin Dataset为研究者提供了丰富的市场交易数据,涵盖了时间戳、价格、交易量、买卖类型等关键信息。近年来,随着区块链技术的快速发展,该数据集被广泛应用于加密货币市场的价格预测、交易策略优化以及市场行为分析等前沿研究。特别是在高频交易和机器学习模型的结合中,研究者利用该数据集的时间序列特性,开发出更为精准的预测算法。此外,随着去中心化金融(DeFi)的兴起,该数据集也为研究者在流动性挖矿、市场波动性分析等热点领域提供了重要支持。其影响不仅限于学术研究,还为金融机构和投资者提供了决策依据,推动了数字货币市场的透明化和规范化发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录