Semsar
收藏github2026-04-03 更新2026-04-04 收录
下载链接:
https://github.com/SoufElhabti/Semsar
下载链接
链接失效反馈官方服务:
资源简介:
每周更新的摩洛哥短期租赁和房地产市场的OSINT快照数据,包括房源元数据、12个月可用性日历和衍生信号。
Weekly updated OSINT snapshot dataset of Morocco's short-term rental and real estate market, including listing metadata, 12-month availability calendars, and derived signals.
创建时间:
2026-04-03
原始信息汇总
Semsar — سمسار 数据集概述
数据集简介
Semsar 是一个关于摩洛哥短期租赁和房地产市场的每周开源情报(OSINT)快照数据集。其核心理念是率先获取数据,进行适当的结构化处理,并揭示其实际含义。
覆盖城市与状态
- 马拉喀什 (Marrakesh): 状态为活跃 (🟢 Active),追踪 260 条房源信息,首次快照日期为 2026-04-02,最新快照日期为 2026-04-02。
- 穆罕默迪耶 (Mohammedia): 状态为活跃 (🟢 Active),追踪 270 条房源信息,首次快照日期为 2026-04-03,最新快照日期为 2026-04-03。
- 卡萨布兰卡 (Casablanca): 状态为即将推出 (🔜 Soon)。
- 阿加迪尔 (Agadir): 状态为即将推出 (🔜 Soon)。
- 非斯 (Fes): 状态为即将推出 (🔜 Soon)。
数据涵盖内容
每个每周快照包含:
- 房源元数据: 价格、评分、评论数量、房产类型、社区、坐标。
- 12个月可用性日历: 每个房源在每日级别的可用性状态(可用、入住日、退房日、最短/最长住宿晚数)。
- 衍生信号: 入住率、预估月收入、连续分析、社区基准。
目标用户
- 房地产投资者: 关注马拉喀什或其他摩洛哥城市短期租赁机会,可通过入住率、社区有效收益率和表现最佳的类似房源获取真实信号。
- 旅行者: 希望了解季节性、预订时机和实际需求情况。
- 研究人员和分析师: 需要关于一个在开放数据中代表性不足的新兴市场的、干净的、有版本控制的、每周更新的数据集。
数据格式
数据以纯 CSV 和 JSON 文件存储,无需特殊工具即可使用。 文件结构示例如下:
data/ └── <city>/ └── <YYYY-MM-DD>/ ← 每周快照对应一个文件夹 ├── listings_master.csv ├── calendar_availability.csv ├── listing_ids.txt └── snapshot_meta.json
数据采集方法
- 采集工具: 使用 Burp Suite 作为本地代理。
- 采集过程: 在正常的 Airbnb 浏览会话期间捕获 API 响应。
- 采集端点: 记录两个 API 端点:
StaysSearch: 包含房源元数据的分页搜索结果。PdpAvailabilityCalendar: 每个房源12个月的每日可用性日历。
- 数据处理: 响应经过 Base64 解码、JSON 解析并结构化为上述数据集。该方法非自动化,不违反任何规定。
数据准确性说明
- 入住率: 根据日历中不可用的日期推导得出。这包括已预订的夜晚和房东屏蔽的日期,应将其视为需求的上限。
- 价格: 为搜索卡片价格(每个房源一个数据点)。由于 Airbnb 的动态定价,实际每晚价格会变化,此数据为快照,非实时数据。
- 坐标: 被 Airbnb 有意模糊处理(约150米偏移)。社区级别的分析是可靠的,但精确的街道位置不可靠。
- 预估月收入: 计算公式为
入住率百分比 × 30 × 每晚价格。此数据仅具有方向性指示意义。
搜集汇总
数据集介绍

构建方式
在房地产与短期租赁市场研究领域,数据获取的时效性与准确性至关重要。Semsar数据集通过每周一次的标准化流程构建,采用Burp Suite作为本地代理,在常规浏览会话中捕获Airbnb的API响应。该方法聚焦于两个核心端点:StaysSearch提供房源元数据,如价格、评分与地理位置;PdpAvailabilityCalendar则提供每套房源12个月的每日可用性日历。原始响应经Base64解码与JSON解析后,被结构化为清晰的CSV与JSON文件,整个过程强调手动观察与可复现性,避免了自动化爬取,确保数据来源的合规性与稳定性。
特点
该数据集以其高频更新与深度结构化信息脱颖而出,覆盖摩洛哥主要城市的短期租赁市场。每周快照不仅包含房源价格、评分、物业类型等静态元数据,还整合了12个月的日历可用性数据,从而衍生出入住率、预估月收入及街区基准等关键信号。数据经过版本控制,以城市和日期层级组织,支持时间序列分析。值得注意的是,数据在保持宏观市场趋势可靠性的同时,对坐标信息进行了模糊处理,并明确标注了入住率与收入估算的指导性边界,为研究者提供了透明且实用的分析基础。
使用方法
对于使用者而言,Semsar数据集的设计注重易用性与灵活性。数据以纯文本CSV和JSON格式存储,无需专用工具,可直接通过pandas、Excel或R等常见数据分析软件读取。用户可依据城市文件夹与日期子目录定位特定快照,其中listings_master.csv包含房源核心属性,calendar_availability.csv则提供可用性详情。该数据集适用于多类应用场景:房地产投资者可分析街区层面的入住率与收益潜力;旅行者能探究需求季节性以优化预订策略;研究人员则可借助其版本化、每周更新的特性,开展新兴市场的纵向比较与趋势建模。
背景与挑战
背景概述
在数字时代,开放数据与房地产市场分析的交叉领域日益受到关注,尤其对于新兴市场而言,缺乏系统化、可追溯的短期租赁数据成为研究瓶颈。Semsar数据集应运而生,由独立研究者于2026年发起,通过每周定期的开源情报收集,聚焦摩洛哥主要城市的短期租赁与房地产市场动态。该数据集的核心研究问题在于揭示市场真实供需状况、季节性波动及投资回报潜力,旨在为投资者、旅行者及研究人员提供基于实证的决策支持,填补了该区域在开放数据领域的空白,对区域经济研究与市场透明度提升具有积极意义。
当前挑战
Semsar数据集致力于解决短期租赁市场分析中数据稀缺与信息不对称的挑战,具体包括准确估算房源占用率、动态价格追踪以及地理定位精度问题。在构建过程中,研究者面临多重技术障碍:需通过人工代理而非自动化工具捕获Airbnb API响应,确保数据收集的合规性与稳定性;原始数据中的坐标模糊处理限制了街道级分析,而日历可用性数据需区分预订与房东屏蔽日期,增加了衍生指标如月度收入估算的复杂性。此外,维持每周快照的版本一致性与城市扩展计划,也对数据集的持续更新提出了操作层面的考验。
常用场景
经典使用场景
在房地产与旅游经济学领域,Semsar数据集以其对摩洛哥短期租赁市场的周度观测,为研究人员提供了动态分析市场趋势的经典场景。通过整合房源元数据与长达12个月的可用性日历,该数据集支持对城市级住房供需、季节性波动及定价策略的深入探究,尤其适用于构建时间序列模型以揭示市场内在规律。
解决学术问题
该数据集有效解决了新兴市场数据稀缺的学术困境,为区域经济学、旅游管理及城市研究提供了可靠实证基础。通过提供结构化的房源价格、评分及入住率信号,研究者能够量化短期租赁经济对本地住房市场的影响,验证理论模型如供需弹性、邻里效应与季节性需求预测,从而填补了摩洛哥等发展中地区在开放数据领域的空白。
衍生相关工作
围绕Semsar数据集,已衍生出多项聚焦市场分析的经典工作,包括基于时间序列的入住率预测模型、邻里房价差异的时空可视化研究,以及短期租赁经济对传统住房市场影响的比较分析。这些工作不仅深化了对摩洛哥城市动态的理解,也为全球类似新兴市场的开放数据方法论提供了可复制的分析框架。
以上内容由遇见数据集搜集并总结生成



