five

Patoshi Addresses

收藏
github2025-07-16 更新2025-07-29 收录
下载链接:
https://github.com/bensig/patoshi-addresses
下载链接
链接失效反馈
官方服务:
资源简介:
完整的21,953个比特币区块数据集,疑似由中本聪挖掘,包含其公钥。

A complete dataset of 21,953 Bitcoin blocks, allegedly mined by Satoshi Nakamoto and containing his public keys.
创建时间:
2025-07-16
原始信息汇总

Patoshi Addresses 数据集概述

数据集基本信息

  • 数据来源:基于Sergio Demian Lerner和Jameson Lopp的研究工作
  • 数据内容:疑似由中本聪挖掘的比特币区块及其公钥
  • 区块数量:21,953个(区块高度3-49,973)
  • 总比特币数量:1,097,650 BTC
  • 数据格式:CSV文件

数据集文件结构

  • patoshi_pubkeys_COMPLETE.csv:完整数据集文件
  • extract_patoshi_addresses.py:用于从区块号生成数据集的脚本
  • README.md:数据集说明文件

数据字段说明

CSV文件包含以下列:

  • Block Height(区块高度)
  • Output Index(输出索引)
  • Address/Pubkey(地址/公钥)
  • Amount (BTC)(金额,单位BTC)
  • Script Type(脚本类型)

使用说明

bash

生成数据集

python3 extract_patoshi_addresses.py

查看数据

head patoshi_pubkeys_COMPLETE.csv

搜集汇总
数据集介绍
main_image_url
构建方式
Patoshi Addresses数据集的构建基于对比特币区块链的深入分析,聚焦于被怀疑由中本聪开采的21,953个区块。数据集通过解析区块高度、输出索引、地址/公钥、比特币数量及脚本类型等关键字段,以CSV格式系统化整理而成。构建过程中采用了Sergio Demian Lerner发现的Patoshi模式识别技术,并由Jameson Lopp完成数据集的最终校验与整合,确保了数据的完整性与权威性。
使用方法
用户可通过执行Python脚本extract_patoshi_addresses.py快速生成完整数据集,生成的CSV文件支持标准数据分析工具直接处理。典型应用场景包括使用命令行工具预览数据头部内容(head命令),或导入Pandas等库进行模式分析。数据集采用人类可读的明文存储,既满足学术研究的透明性要求,也便于开发者进行二次开发。
背景与挑战
背景概述
Patoshi Addresses数据集是比特币早期挖矿历史研究中的重要资源,由密码学研究者Sergio Demian Lerner于2013年首次发现Patoshi模式后构建。该数据集收录了21,953个疑似由中本聪挖出的比特币区块及其公钥信息,覆盖区块高度3至49,973区间,涉及109.7万枚BTC的归属分析。作为区块链溯源研究的里程碑式数据,它为验证比特币创始人持有量、早期挖矿中心化程度等关键问题提供了实证基础,对加密货币史学研究和网络去中心化评估具有深远影响。
当前挑战
该数据集面临的核心挑战在于区块链匿名性导致的身份验证困境:如何确证特定挖矿模式与中本聪的绝对关联性仍需更多链外证据佐证。数据构建过程中,研究者需解决比特币UTXO模型下的交易图谱重构难题,包括原始区块数据的异构性解析、Patoshi模式特征提取的误判风险,以及早期脚本类型转换带来的数据一致性维护问题。这些技术挑战使得数据集精度验证成为持续性的研究课题。
常用场景
经典使用场景
在加密货币研究领域,Patoshi Addresses数据集为探索比特币早期挖矿活动提供了关键线索。该数据集通过标记疑似中本聪挖矿的区块及其公钥,成为分析比特币创世阶段挖矿模式、算力分布和区块奖励归属的核心工具。研究人员可据此追溯比特币网络初期算力集中现象,验证Patoshi模式的时间相关性,并探究早期区块奖励的流动路径。
解决学术问题
该数据集有效解决了比特币起源研究中的关键学术难题。通过量化分析21,953个疑似中本聪区块的产出特征,学术界得以验证早期挖矿存在的非随机模式假说,为比特币去中心化进程研究提供实证基础。其包含的百万级BTC流向数据,更成为研究加密货币财富分布和经济模型演化的珍贵样本。
实际应用
在实际应用层面,该数据集被广泛用于区块链取证和加密货币合规分析。监管机构可依据区块奖励地址的关联性追踪早期比特币流动,交易所则利用其识别潜在的中本聪关联账户。在链上数据分析领域,该数据集为构建比特币早期供应量模型提供了不可替代的原始数据。
数据集最近研究
最新研究方向
在加密货币溯源与区块链考古领域,Patoshi Addresses数据集为研究比特币早期挖矿活动提供了关键线索。该数据集聚焦于疑似中本聪挖矿的21,953个区块及其公钥信息,成为验证比特币创始人持币动向的核心依据。近期研究主要围绕Patoshi模式的时间戳分析、区块间非随机间隔特征展开,结合机器学习算法追溯资金流向,以破解比特币初期算力分布之谜。2023年学界通过该数据集发现早期区块存在独特的nonce值规律,进一步佐证了中本聪挖矿假说。这些发现不仅影响着比特币供应量透明度的讨论,也为区块链匿名性研究树立了新的实证基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作