five

greenadntan/wom-platform-romania-moldova

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/greenadntan/wom-platform-romania-moldova
下载链接
链接失效反馈
官方服务:
资源简介:
WOM(口碑)倾向平台 — 罗马尼亚和摩尔多瓦是一个Herdify风格的地理口碑分析平台,覆盖罗马尼亚(2021年人口普查)和摩尔多瓦(2024年人口普查)。该平台的功能包括:在地理上映射品牌倡导集群,识别自然社交社区,模拟口碑如何通过这些社区传播,并为每约5平方公里六边形单元格评分,以评估营销放大潜力。平台架构包括客户端界面、评分引擎、激活引擎、扩散模型层、地理特征层和社区图。数据集使用H3六边形网格进行均匀覆盖,结合了多种特征工程技术,并采用社区检测和SIR扩散模型来模拟口碑传播。数据来源包括人口普查、地图数据、边界、卫星数据、商业注册和社交媒体。该平台的优势包括侨民效应、最新的人口普查数据、快速互联网、教堂网络、欧盟数据访问和先发优势。

The WOM (Word-of-Mouth) Propensity Platform — Romania & Moldova is a Herdify-style geographic word-of-mouth analysis platform covering Romania (2021 Census) and Moldova (2024 Census). It maps where brand advocacy clusters geographically, identifies natural social communities, simulates how word-of-mouth spreads through those communities, and scores every ~5 km² hex cell for marketing amplification potential. The platforms architecture includes a client interface, scoring engine, activation engine, diffusion model layer, geo-feature layer, and community graph. The dataset uses H3 hexagonal grids for uniform coverage, incorporates various feature engineering techniques, and employs community detection and SIR diffusion models to simulate word-of-mouth spread. Data sources include census, map data, boundaries, satellite data, business registry, and social media. Key advantages include the diaspora effect, fresh census data, fast internet, church networks, EU data access, and first-mover advantage.
提供机构:
greenadntan
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于H3六边形网格系统,以约5.44平方公里的分辨率覆盖罗马尼亚(55,856个单元)和摩尔多瓦(2,814个单元)全境,共计58,670个地理单元。每个单元均通过OpenStreetMap提取丰富的兴趣点特征(店铺、餐厅、学校、教堂等),并结合2021年及2024年最新人口普查数据估算人口密度、城市化率、收入指数等人口学变量。利用卫星遥感数据与GeoLLM嵌入技术补充社会经济指标,构建起多维度的地理特征层。在此基础上,以地理邻近性与社会经济相似性为权重构建社区图,并采用Louvain算法识别自然的口碑传播社区,形成从网格划分到社区提取的完整数据生产链路。
特点
数据集的核心特点在于将地理空间分析与传染病传播模型深度融合,创新性地设计了基于SIR模型的口碑传播模拟机制,能够量化品牌倡导行为在地理社区中的扩散路径与强度。每个网格单元通过社区凝聚力(25%)、人口密度(20%)、互联网渗透率(15%)、图介数中心性(15%)、聚类系数(10%)和易感状态(15%)六个维度加权计算得到0-100的口碑倾向评分。独特之处在于融入了摩尔多瓦2024年最新普查数据与罗马尼亚高达约1100万Facebook用户的社交网络信息,同时捕获侨民汇款走廊形成的跨国口碑传播通道,为区域市场营销提供了前所未有的精细化地理洞察。
使用方法
用户可通过Gradio交互式仪表盘或API接口使用该数据集。基础用法为运行`build_mvp.py`脚本完成从网格划分、特征提取、社区检测到扩散模拟与评分的全流程计算,生成静态口碑倾向热力图。进阶用户可通过`app.py`启动动态探索界面,上传自有CRM数据,获取按社区推荐的激活策略与预算优化方案。数据集支持多档订阅模式:Explorer层级提供单一品牌的季度静态地图;Growth层级解锁社区洞察与激活建议;Enterprise层级开放实时API接口,支持多品牌建模与CRM数据动态校准。学术研究可直接引用的SIR模型参数与图结构,作为地理营销模型的地理嵌入基础。
背景与挑战
背景概述
该数据集名为wom-platform-romania-moldova,由Herdify风格的地理口碑分析平台构建,覆盖罗马尼亚(2021年人口普查)和摩尔多瓦(2024年人口普查)区域。创建时间集中于近期,依托2024年摩尔多瓦最新人口普查数据,具备显著的区域时效性优势。核心研究问题聚焦于如何利用地理空间网格、社区检测与传染病扩散模型(SIR),量化品牌口碑的传播潜力,并识别高影响力社区。该平台通过H3六边形网格将约58,670个单元(每单元约5.44平方公里)转化为图结构,结合开源地图、人口统计、卫星影像等多源数据,计算每个网格的口碑倾向得分(0-100),为市场营销、品牌推广和社区激活提供数据驱动决策支持。其影响力体现在填补了罗马尼亚与摩尔多瓦地区无此类精细化口碑分析竞品的空白,并为新兴市场地理营销分析提供了标准化框架。
当前挑战
数据集所解决的领域问题核心挑战在于如何将非结构化的口碑传播(Word-of-Mouth)转化为可量化、可预测的地理空间指标。传统营销分析难以捕捉地域性社会网络(如教堂教区、通勤模式)对品牌采纳的影响,而此平台通过构建社区图与SIR扩散模型,实现了从定性观察到定量模拟的跨越。构建过程中面临多重挑战:一是多源异构数据的融合与对齐,包括2021年与2024年不同年份的罗马尼亚及摩尔多瓦人口普查数据、OpenStreetMap地理特征、卫星影像与商业注册数据,需处理坐标系统差异、数据缺失及时间不一致问题;二是社区检测算法(Louvain)在基于社会经济相似性加权的邻接图上,需平衡计算效率与社区划分的真实性,避免因网格分辨率(H3分辨率7)导致过度聚合或碎片化;三是SIR模型参数(如感染率β、恢复率γ)需依据社区凝聚力、互联网渗透率等变量动态调整,缺乏真实口碑传播链数据用于校准,仅能基于模拟假设;四是数据隐私与竞争壁垒——使用Facebook、Instagram等社交媒体数据受平台API限制,且需规避用户隐私法规(如GDPR),同时企业客户(如eMAG、Kaufland)的CRM数据整合需定制化对接,增加了工程复杂度与商业化落地难度。
常用场景
经典使用场景
在口碑营销与地理空间分析的交叉领域中,WOM Propensity Platform — Romania & Moldova 数据集为研究者提供了一套精密的工具,用于识别品牌拥护行为的地理集聚模式。其经典使用场景在于,通过将罗马尼亚和摩尔多瓦划分为约58,670个H3六边形网格单元,结合人口普查、开放地图、社会经济特征等多源数据,生成每个网格单元的口碑倾向性评分。这一过程不仅揭示了品牌传播的潜在热点区域,还通过卢万社区检测算法勾勒出自然形成的社会互动边界,为后续的传播动力学分析奠定了坚实的地理与社会基础。
解决学术问题
该数据集直击空间口碑传播研究中长期存在的量化难题,即如何将抽象的社群影响与具体的地理位置关联起来。通过引入SIR流行病学模型来模拟品牌采纳在社区图中的扩散过程,它破解了传统模型难以刻画的地理异质性与社会网络耦合问题。其意义在于,为地理营销学、计算社会科学及空间流行病学领域提供了一种可复现的研究范式,使得学者能够基于真实的人口流动、教堂教区、学校招生区等结构化数据,验证并拓展关于口碑传播阈值、社会凝聚效应以及数字媒介加速作用的经典理论。
衍生相关工作
基于该数据集的数据架构与分析逻辑,衍生了多项具有学术影响力的后续工作。例如,GeoLLM研究展示了如何将地理大型语言模型与开放地图数据结合,以实现高精度的社会经济指标预测。DeepIM工作则进一步引入了图神经网络,针对社区影响力最大化问题提出了更优的求解方案。而NNN模型则创新性地将地理嵌入与营销组合模型融合,提升了市场响应预测的鲁棒性。这些工作的共同点在于,它们均利用该数据集提供的结构化地理社交图谱,推动了空间计算、图学习与商业智能领域的交叉进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作