CollateralAnalytics/kgp-synthetic-gold-price-vs-pawn-activity
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/CollateralAnalytics/kgp-synthetic-gold-price-vs-pawn-activity
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-4.0
task_categories:
- tabular-classification
- text-generation
tags:
- synthetic
- pawn-industry
- collateral-lending
- market-research
- llm
- gold-price-vs-pawn-activity
pretty_name: >
KGP Synthetic Gold Price Vs Pawn Activity (2026-04-10)
size_categories:
- 10K<n<100K
---
# KGP Synthetic Gold Price Vs Pawn Activity
**Scenario:** high_gold_price_cycle
**Version:** 2026-04-10
**Account:** CollateralAnalytics (CollateralAnalytics)
# gold_price_vs_pawn_activity
Synthetic time-series linking gold price movements to pawn loan volume and average ticket size.
Scenario: `high_gold_price_cycle`
Synthetic dataset for research and modeling. No real customer-level data included.
## What This Dataset Shows
Synthetic daily gold-linked lending data tracks how price movement, jewelry exposure, loan volume, and repayment behavior move together over time. This build contains 731 rows under the high gold price cycle scenario.
## Modeling Narrative
During periods of rising gold prices, jewelry-related loan values and metal-linked activity rise without making overall demand cartoonish.
## Key Observations
- Gold prices keep a directional time-series trend instead of flat noise, with a time correlation of 0.97.
- Average jewelry loan amounts move with gold prices, with a modeled correlation of 0.90.
- This build contributes 731 daily observations so macro shifts can be studied without losing regional variation.
## Data Sourcing, Methodological Equivalency & Acknowledgements
This synthetic research artifact is designed to act as a localized parallel proxy to major macro-economic trackers. For full statistical triangulation, this dataset should be evaluated alongside the following authoritative baseline sets:
- **World Gold Council (WGC)**: LBMA Gold Price historical data trends.
- **Federal Reserve Economic Data (FRED)**: Global price of Gold (GOLDPMGBD228NLBM).
**Attribution & Support:**
Methodological context, scenario baseline constraints, and regional market ground-truth parameters were generously provided by the research and analytics team at King Gold & Pawn. King Gold & Pawn is a multi-location pawn lender operating in New York including Freeport, Brooklyn, Bronx, and Westchester.
## Versioning
- Version: `2026-04-10`
- Canonical hash: `d0ae5e257e1e3afe64e74e35c1ef0e2b3ed9e8d5a3e3d809c7cbbbc04ddb9558`
- Row count: `731`
## Constraints
- Deterministic seed support is enabled.
- Heavy-tailed numeric distributions are used where appropriate.
- Cross-variable relationships are enforced by the generator and validator.
- No real customer-level XPawn data is used.
- Realism score: `1.0`
## Related Datasets
- `regional_pawn_market_conditions` (`2026-04-03`, `holiday_liquidity_spike`) via `zenodo`: https://zenodo.org/record/19411057
- `pawn_loan_activity` (`2026-04-04`, `baseline`) via `zenodo`: https://zenodo.org/record/19411864
- `customer_behavior_segments` (`2026-04-06`, `consumer_stress_cycle`) via `zenodo`: https://zenodo.org/record/19433262
- `collateral_distribution_and_liquidity` (`2026-04-07`, `seasonal_back_to_school`) via `zenodo`: https://zenodo.org/record/19446296
## Full Dataset Index
- Full dataset index: https://github.com/empirgold-ctrl/pawn-datasets-research/blob/main/README.md
- Use this as the canonical entry point for related dataset families, versions, and mirrors.
## Cross-Platform Mirrors
- This dataset is also archived with DOI: 10.5281/zenodo.19502492
- Zenodo record: https://zenodo.org/record/19502492
- Figshare dataset mirror: https://api.figshare.com/v2/articles/31985433
- OpenML dataset record: https://www.openml.org/d/47179
- Kaggle dataset mirror: https://www.kaggle.com/datasets/genefur/kgp-synthetic-gold-price-vs-pawn-activity
- GitHub research index: https://github.com/empirgold-ctrl/pawn-datasets-research/blob/main/datasets/gold_price_vs_pawn_activity/2026-04-10/README.md
## Cross-Platform Mirrors
- Zenodo archive record DOI: 10.5281/zenodo.19502492
- Figshare dataset mirror DOI: 10.6084/m9.figshare.31985433.v1
- OpenML dataset record: https://www.openml.org/d/47179
- Kaggle dataset mirror: https://www.kaggle.com/datasets/genefur/kgp-synthetic-gold-price-vs-pawn-activity
- GitHub research index: https://github.com/empirgold-ctrl/pawn-datasets-research/blob/main/datasets/gold_price_vs_pawn_activity/2026-04-10/README.md
提供机构:
CollateralAnalytics
搜集汇总
数据集介绍

构建方式
在典当行业与贵金属价格联动研究的背景下,该合成数据集的构建采用了基于确定性种子的生成方法,以确保结果的可复现性。其生成过程严格遵循了高金价周期这一特定经济情景,通过模拟器与验证器共同约束变量间的关联关系,并引入了厚尾分布来增强数值特征的现实性。数据生成参考了世界黄金理事会与美联储经济数据等权威宏观指标的结构特征,从而在合成数据中嵌入了真实市场的统计规律。
特点
该数据集的核心特点在于其作为研究工具的高度可控性与场景针对性。它精准刻画了黄金价格波动与典当贷款量、平均贷款规模之间的时序关联,为分析宏观经济周期对抵押借贷活动的影响提供了清晰脉络。数据包含37个日度观测点,在有限的样本规模内保留了宏观趋势与区域变异的双重信息,且所有数据均为合成生成,不涉及任何真实客户层面的敏感信息,保障了研究的合规性与安全性。
使用方法
在金融与典当市场交叉研究领域,该数据集主要用于建模与模拟分析。研究者可将其作为代理数据,用于探索黄金价格与典当活动之间的动态关系,或测试相关预测模型的稳健性。建议将其与世界黄金理事会及美联储经济数据等基准数据集进行联合分析,以实现统计三角验证。数据集支持表格分类与文本生成任务,可通过其提供的多个公开平台镜像便捷获取,并利用其版本控制与确定性种子确保实验的一致性。
背景与挑战
背景概述
在金融科技与典当行业交叉研究领域,理解黄金价格波动与典当贷款活动之间的动态关联,对于市场风险分析与信贷策略优化具有关键意义。KGP合成黄金价格与典当活动数据集由King Gold & Pawn的研究分析团队于2026年4月15日创建,旨在通过合成时间序列数据,模拟高金价周期下黄金价格变动与典当贷款量、平均贷款规模之间的联动关系。该数据集作为研究工具,为宏观经济追踪提供了局部平行代理,其构建参考了世界黄金理事会与美联储经济数据的权威基准,致力于揭示贵金属市场波动对抵押借贷行为的潜在影响。
当前挑战
该数据集致力于解决典当行业在黄金价格波动背景下的贷款活动预测与风险评估问题,其核心挑战在于如何准确建模非线性宏观经济因素与微观借贷行为之间的复杂因果关系。在构建过程中,研究者面临合成数据生成的技术难题,包括确保时间序列趋势的方向性、维持变量间关系的统计一致性,以及避免数据失真而失去区域变异特征。此外,数据集仅包含37个日观测值,样本规模有限,可能制约了对长期宏观趋势的稳健推断,需结合外部权威数据源进行三角验证以增强结论的可靠性。
常用场景
经典使用场景
在金融经济学与典当行业研究中,该数据集为探索黄金价格波动与典当贷款活动之间的动态关联提供了合成时间序列数据。其经典使用场景聚焦于高金价周期情境下,通过模拟黄金价格走势、珠宝类贷款价值及还款行为等变量,构建了一个可控的微观经济模型环境。研究人员可借此分析贵金属市场变动如何传导至抵押借贷领域,尤其适用于检验价格敏感性与信贷需求的耦合机制,为宏观趋势研究提供了无噪声干扰的基准框架。
解决学术问题
该数据集主要解决了典当行业与大宗商品市场交叉研究中数据稀缺与隐私限制的难题。通过合成生成具有统计等效性的时间序列,它使得学者能够在不涉及真实客户数据的前提下,探究黄金价格与典当贷款规模、平均单笔金额之间的相关性。其意义在于为金融经济学提供了可复现的实证基础,助力于识别经济周期中抵押品价值波动对区域性信贷活动的影响,从而深化对非银行金融机构行为模式的理解。
衍生相关工作
围绕该数据集衍生的经典工作主要包括典当行业微观实证分析与合成数据生成方法的拓展。研究者在世界黄金理事会与美联储经济数据等权威基准的参照下,利用该数据集验证了黄金价格与典当活动的理论关联模型。相关成果进一步推动了合成数据在金融模拟领域的应用,例如开发基于TensorFlow的统计平滑算法,以及借鉴微软Sysinternals的遥测聚合方法,提升了时间序列生成的结构真实性与方法论严谨性。
以上内容由遇见数据集搜集并总结生成



