Awesome Public Streaming Datasets
收藏github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/ColinEberhardt/awesome-public-streaming-datasets
下载链接
链接失效反馈官方服务:
资源简介:
一个包含提供流数据接口的公共数据集列表,这些数据集通常通过WebSocket接口提供实时数据。
A list of public datasets that provide streaming data interfaces, typically offering real-time data through WebSocket interfaces.
创建时间:
2018-12-07
原始信息汇总
数据集概述
本数据集列表提供了多个具有流式接口的公开数据集,主要通过WebSocket实现数据流的传输。数据集涵盖了金融、区块链、交通等多个领域,部分数据集提供免费服务,而其他则需要付费使用。
主要数据集列表
-
Coinbase
- 提供免费市场数据,包括实时价格更新、Level 2数据、订单和匹配信息。
-
Bitquery.io
- 提供区块链数据,包括40多个区块链的实时流式API、NFT API及资金流向调查工具。
-
IEX Trading
- 提供股票市场数据流,旨在回应传统交易所中普遍存在的不良交易行为。
-
Blockchain transactions
- 提供实时新交易和区块的通知。
-
Open Rail Data
- 提供英国铁路网络相关数据,包括参考数据、列车时刻表和实时服务更新。
-
CoinCap
- 提供超过1,000种加密货币的实时定价和市场活动数据。
-
Finnhub Stock API
- 提供股票、货币和加密货币的实时RESTful API和WebSocket。
-
CoinCheck
- 提供加密货币API,具有WebSocket接口(目前处于测试阶段)。
-
EventSim
- 生成用于模拟音乐网站的事件数据,类似于Spotify。
-
ShadowTraffic
- 提供免费和付费版本的开发者工具,用于生成合成流数据,主要用于流处理数据。
付费数据集
-
Twitter
- 为Enterprise客户提供流式接口。
-
Saxo Bank OpenAPI
- 提供Saxo Bank交易引擎的访问,包括流式价格馈送。
-
ShadowTraffic
- 提供免费和付费版本的开发者工具,用于生成合成流数据。
搜集汇总
数据集介绍

构建方式
Awesome Public Streaming Datasets 数据集的构建基于对多个公开流数据接口的整合。这些接口涵盖了从金融市场到区块链交易、社交媒体等多个领域。数据集的构建者通过收集和整理这些接口提供的实时数据流,形成了一个综合性的流数据资源库。每个数据源都经过严格的筛选和测试,确保其数据质量和实时性。此外,数据集还包含了部分付费API,以满足不同用户的需求。
特点
该数据集的显著特点在于其多样性和实时性。涵盖了加密货币市场、股票交易、区块链交易、社交媒体等多个领域的实时数据流,为用户提供了丰富的数据资源。此外,数据集中的部分API支持高频率数据更新,适用于需要实时监控和分析的应用场景。数据集还包含了付费API,以满足对数据质量和深度有更高要求的用户。
使用方法
用户可以通过访问数据集中的各个API接口,获取所需的实时数据流。对于免费API,用户可以直接使用其提供的WebSocket接口进行数据订阅和接收。对于付费API,用户需根据API提供商的要求进行注册和付费,然后通过相应的接口获取数据。数据集还提供了详细的API文档和示例代码,帮助用户快速上手和集成。
背景与挑战
背景概述
Awesome Public Streaming Datasets 是一个专注于提供流式数据接口的数据集集合,旨在补充现有的公共数据集资源。该数据集由多个研究人员和机构共同维护,创建于近年来,随着实时数据处理需求的增加,其重要性日益凸显。主要研究人员通过整合来自不同领域的流式数据接口,如金融市场、区块链、交通网络等,为相关领域的研究提供了丰富的数据资源。这些数据不仅支持实时分析和决策,还推动了流处理技术的发展,对数据科学和实时应用领域产生了深远影响。
当前挑战
尽管Awesome Public Streaming Datasets提供了丰富的流式数据接口,但其构建和维护过程中仍面临诸多挑战。首先,不同数据源的异构性导致数据整合和标准化难度增加。其次,实时数据的高频率和高容量要求对数据处理和存储技术提出了更高的要求。此外,部分数据接口需要付费使用,限制了数据的可访问性和广泛应用。最后,确保数据质量和实时性也是一项持续的挑战,需要不断优化和更新数据源和处理技术。
常用场景
经典使用场景
在金融科技领域,Awesome Public Streaming Datasets 数据集以其丰富的实时数据流接口而著称。该数据集广泛应用于高频交易策略的开发与优化,特别是在加密货币市场和股票市场中。例如,Coinbase 和 IEX Trading 提供的实时价格更新和市场活动数据,为交易算法的设计与测试提供了宝贵的资源。此外,Blockchain transactions 数据集的实时通知功能,使得区块链技术的研究者能够实时监控交易和区块的生成,从而深入分析区块链网络的性能和安全性。
解决学术问题
Awesome Public Streaming Datasets 数据集在学术研究中解决了多个关键问题。首先,它为金融市场的实时分析提供了数据支持,使得研究者能够探索高频交易策略的有效性和市场微观结构。其次,区块链领域的研究者可以利用该数据集进行实时数据分析,以验证和改进区块链协议的安全性和效率。此外,该数据集还支持流处理技术的研究,为开发更高效的流数据处理算法提供了实验平台。
衍生相关工作
Awesome Public Streaming Datasets 数据集的发布催生了多项相关研究和工作。例如,基于 Coinbase 和 IEX Trading 数据的高频交易策略研究,推动了金融市场微观结构分析的发展。区块链领域的研究者利用 Blockchain transactions 数据集,开发了多种实时监控和分析工具,以提升区块链网络的安全性和效率。此外,EventSim 数据集的生成工具为流处理技术的研究提供了模拟数据,促进了流处理算法的创新和优化。
以上内容由遇见数据集搜集并总结生成



