five

retro-sync

收藏
Hugging Face2026-03-30 更新2026-03-31 收录
下载链接:
https://huggingface.co/datasets/introspector/retro-sync
下载链接
链接失效反馈
官方服务:
资源简介:
Retro-Sync: Hurrian Hymn h.6 NFT 数据集是一个多层次的 NFT 集合,编码了世界上现存最古老的记谱音乐(约公元前 1400 年,乌加里特),并包含零知识证明和隐写嵌入技术。数据集包含 71 个 DA51 CBOR 分片,每个分片包含不同类型的内容,如巴比伦符号、LilyPond 乐谱、MIDI、PDF 乐谱、WAV 音频和元数据。数据集还提供了详细的结构描述、解码过程、零知识验证方法,并采用 AGPL-3.0-or-later 许可证。适用于音频分类、文本生成等任务,涉及古代音乐、楔形文字、零知识证明等多个领域。

Retro-Sync: Hurrian Hymn h.6 NFT Dataset is a multi-tiered NFT collection that encodes the oldest surviving notated music in the world (c. 1400 BCE, Ugarit), and integrates zero-knowledge proofs and steganographic embedding technologies. The dataset comprises 71 DA51 CBOR shards, with each shard containing diverse content types including Babylonian cuneiform symbols, LilyPond sheet music, MIDI files, PDF sheet music, WAV audio files and metadata. It also provides detailed structural descriptions, decoding procedures, zero-knowledge verification methods, and is licensed under AGPL-3.0-or-later. This dataset is suitable for tasks such as audio classification and text generation, and covers multiple research fields including ancient music, cuneiform, and zero-knowledge proofs.
创建时间:
2026-03-22
原始信息汇总

Retro-Sync: Hurrian Hymn h.6 NFT 数据集概述

数据集基本信息

  • 数据集名称: Retro-Sync: Hurrian Hymn h.6 — 71-Shard NFT Collection
  • 许可协议: AGPL-3.0-or-later
  • 任务类别: 音频分类、文本生成
  • 语言: 阿卡德语 (akk)、英语 (en)
  • 标签: 音乐、古代音乐、胡里安、楔形文字、NFT、零知识证明、隐写术、DA51、CBOR、ERDFA
  • 数据规模: 1K < n < 10K

数据集内容描述

该数据集将世界上现存最古老的记谱音乐(约公元前1400年,乌加里特)编码为一个多层NFT收藏集,包含零知识证明和隐写嵌入。

收藏集构成

  • 71个DA51 CBOR分片: 对应整数1至71(皇冠质数)。
  • 20个生成器分片: 质数(≤71)分片,携带SSP音程结构。
  • 51个衍生分片: 合数分片,内容由质因数分解决定。

数据层与格式

内容 格式
源数据 巴比伦记谱法,音程映射 文本
乐谱 LilyPond乐谱(West 1994) .ly
衍生文件 MIDI、PDF乐谱、WAV音频 base64编码于CBOR中
见证数据 编译链(5个步骤) JSON
特征空间 地球/辐条/中心分解 数值
元数据 泥板、抄写员、调音、神祇 结构化数据
参考文献 维基百科、学术文献、LilyPond文档 URL
YouTube链接 私有音频比较源 URL
处理流程 SOP、erdfa CFT、牛耕式书写法、Cl(15) 文本
零知识证明 Groth16/BN254、MiMC默克尔树 JSON

数据结构

shards/ # 595个erdfa CFT分解分片 nft71/ # 71个DA51 CBOR分片(真实数据,11.2 MB) ├── 01.cbor # 保留 ├── 02.cbor # ★ nīš tuḫrim (p2) ├── ... ├── 10.cbor # WAV音频(8.4 MB base64) ├── ... ├── 71.cbor # ★ 题署/皇冠 (p71) └── manifest.json proof/ └── nft71_proof.json # Groth16证明 witnesses/ └── hurrian_h6_witness.json

解码方法

每个分片是一个DA51标签的CBOR封装:

  • 字节0-1: 0xDA 0x51(魔术字)
  • 字节2-9: SHA-256前缀(CID存根)
  • 字节10+: CBOR有效载荷

示例Python解码代码: python import cbor2, json with open("nft71/02.cbor", "rb") as f: raw = f.read() magic = raw[:2] # bxdax51 cid = raw[2:10].hex() payload = cbor2.loads(raw[10:]) print(json.dumps(payload, indent=2))

零知识证明验证

Groth16证明验证以下内容:

  1. 证明者知晓所有71个分片的哈希值。
  2. 所有分片构成一个有效的MiMC默克尔树。
  3. 特征空间承诺匹配(100%地球)。
  4. 皇冠分片(p71)是唯一的。

相关链接

  • 代码仓库:https://github.com/meta-introspector/retro-sync
  • 维基百科:胡里安歌曲:https://en.wikipedia.org/wiki/Hurrian_songs
搜集汇总
数据集介绍
main_image_url
构建方式
在音乐考古学与数字保存的交叉领域,Retro-Sync数据集通过创新的技术架构,将现存最古老的记谱音乐——胡里安赞美诗h.6(约公元前1400年)——转化为多层次的非同质化代币(NFT)收藏。其构建过程以71个DA51 CBOR数据分片为核心,对应1至71的整数(即皇冠素数)。其中,20个生成器分片(小于等于71的素数)承载了SSP音程结构,而51个衍生分片(合数)则通过素数分解确定内容。每个分片均采用CBOR编码,并集成了零知识证明与隐写术嵌入,确保了数据的完整性与可验证性。
特点
该数据集融合了古代音乐遗产与现代密码学技术,呈现出多模态与结构化的显著特点。它不仅包含了巴比伦记谱法、LilyPond乐谱、MIDI、PDF乐谱及WAV音频等多种格式的内容,还通过特征空间分解(地球/辐条/枢纽)与元数据(如泥板、抄写员、调音、神祇信息)提供了丰富的上下文。数据集采用零知识证明(Groth16/BN254,MiMC Merkle树)来验证所有71个分片哈希值的完整性与唯一性,同时通过隐写术将信息嵌入,实现了艺术性、学术性与安全性的有机结合。
使用方法
使用Retro-Sync数据集时,研究人员或开发者可通过解码CBOR分片来访问其多层次内容。每个分片以DA51标签的CBOR信封形式存储,前两个字节为魔术头,随后是SHA-256前缀(CID存根),其余部分为CBOR有效载荷。利用Python的cbor2库可轻松加载并解析分片数据,进而提取乐谱、音频或元数据。数据集附带的零知识证明文件允许用户验证分片集合的完整性与一致性,确保数据在传输或存储过程中未被篡改。此外,数据集遵循AGPL-3.0许可,为学术研究、数字艺术或区块链应用提供了灵活的使用基础。
背景与挑战
背景概述
Retro-Sync数据集由meta-introspector团队于2024年构建,旨在通过现代数字技术对现存最古老的乐谱——胡里安赞美诗第六号(约公元前1400年,乌加里特)进行多模态编码与保存。该数据集将楔形文字乐谱、音乐符号学分析与区块链技术深度融合,以71个基于DA51 CBOR格式的分片化NFT为载体,集成了零知识证明与隐写术等密码学方法。其核心研究问题聚焦于如何利用分布式账本与形式化验证手段,为古代文化遗产构建可验证、防篡改且具备复杂语义结构的数字孪生体,为数字人文、音乐考古与密码学交叉领域提供了开创性范例。
当前挑战
该数据集致力于解决古代音乐复原与数字保存中的多重挑战:首先,胡里安赞美诗的原始楔形文字记录存在符号歧义与断代模糊性,音乐学界对其音高、节奏与调式体系尚未形成共识,导致数字化转译过程面临高度不确定性。其次,构建过程中需将非结构化的历史文献(如巴比伦记谱法、莉莉蓬乐谱、音频文件)映射为可计算的数据结构,同时维持学术严谨性与技术可扩展性。此外,数据集创新性地引入零知识证明机制,需在确保音乐内容完整性的前提下,实现分片化存储的隐私保护与可验证性,这对密码学协议设计(如Groth16证明与MiMC默克尔树)与跨格式数据封装(CBOR、JSON、Base64)提出了严苛的工程要求。
常用场景
经典使用场景
在数字文化遗产与区块链技术交叉领域,Retro-Sync数据集以其独特的结构为古代音乐研究提供了创新范式。该数据集最经典的使用场景在于通过零知识证明和隐写术,将现存最古老的乐谱——胡里安赞美诗h.6(约公元前1400年)编码为71个分片NFT集合,实现了对古老音乐遗产的数字化保全与可验证性研究。学者们可借助该数据集分析巴比伦记谱法与现代乐理之间的映射关系,同时探索基于素数分解的内容分发机制在文化遗产保护中的应用潜力。
衍生相关工作
该数据集已衍生出多个前沿研究方向:在密码学领域,其基于Groth16/BN254的Merkle树验证机制启发了零知识证明在文化遗产溯源中的新应用;在计算音乐学方面,学者们借鉴其Eigenspace分解方法,开发了古代音律体系的频谱分析算法;数字人文领域则受其多层级编码结构影响,涌现出结合CBOR与IPFS的分布式档案存储系统。相关研究进一步拓展了素数分片理论在非对称数据存储中的应用,为跨媒体文化遗产的数字化重构提供了方法论基础。
数据集最近研究
最新研究方向
在数字人文与文化遗产保护领域,Retro-Sync数据集以其独特的跨学科融合,正推动着古代音乐复原与区块链技术的前沿探索。该数据集将公元前1400年的胡里安赞美诗编码为多层NFT收藏,结合零知识证明和隐写术嵌入,为古代楔形文字乐谱的数字化保存提供了创新范式。当前研究热点聚焦于利用ZK证明确保数据完整性与可验证性,同时通过DA51 CBOR分片结构实现音乐内容的可分解与重构,这为文化遗产的分布式存储与抗审查传播开辟了新路径。相关探索还涉及音乐信息检索与古代调式系统的计算分析,旨在深化对早期音乐理论的理解,其影响不仅拓展了数字考古学的技术边界,也为艺术与科技的交叉融合提供了实证案例。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作