Inside Airbnb Australia
收藏Inside Airbnb Australia 数据集概述
概览
关键词: 澳大利亚; Airbnb; 评论
数据来源
数据原始来源为 Inside Airbnb,并遵循 CC BY 4.0 许可协议。详细信息请参阅 Inside Airbnb 数据政策。
本仓库仅存储澳大利亚的 listings.csv[.gz] 和 reviews.csv[.gz] 数据。其他地区的数据请访问 获取数据。
数据结构
InsideAirbnbAustralia 数据集包含来自澳大利亚以下11个地区的详细房源和评论数据:
- 巴罗莎谷,南澳大利亚
- 巴旺南海岸,维多利亚
- 布里斯班,昆士兰
- 墨尔本,维多利亚
- 中北海岸,新南威尔士
- 莫宁顿半岛,维多利亚
- 北部河流,新南威尔士
- 阳光海岸,昆士兰
- 悉尼,新南威尔士
- 塔斯马尼亚,塔斯马尼亚
- 西澳大利亚,西澳大利亚
每个地区都有一个以其名称命名的单独目录,例如 melbourne 和 sunshine-coast。
在每个地区的目录中,有两个子目录 gz 和 csv,其中 csv 包含从 gz 中对应的未压缩的 CSV 文件。
命名约定:
[location]_[date]_listings.csv[.gz]包含来自[location]的详细 Airbnb 房源数据,每约90天记录一次;[location]_[date]_reviews.csv[.gz]包含来自[location]的详细 Airbnb 评论数据,每约90天记录一次。
注意,[date] 用于构建 URL 以检索和下载数据,并不一定代表数据的日期。
更多关于数据的信息,请参阅 获取数据 - Inside Airbnb。
下载
建议通过 utils/download.ipynb 笔记本探索如何构建 URL 以请求和下载数据。
也可以使用 utils/download.py 在终端中直接下载数据。
bash $ python utils/download.py --help
usage: download.py [-h] [-s START_DATE] [-e END_DATE] -l LOCATIONS [LOCATIONS ...] [-r SAVE_ROOT]
Download Inside Airbnb data from Australia.
options: -h, --help Show all help messages. -s START_DATE, --start_date START_DATE Define the start date of the time range (YYY-MM-DD). Default date is set to the date when Airbnb launched in Australia. -e END_DATE, --end_date END_DATE Define the end date of the time range (YYYY-MM-DD). Default date is set to the current date, i.e., today. -l LOCATIONS [LOCATIONS ...], --locations LOCATIONS [LOCATIONS ...] Define the locations you want to download. The possible locations are: - sa/barossa-valley - vic/barwon-south-west-vic - qld/brisbane - vic/melbourne - nsw/mid-north-coast - vic/mornington-peninsula - nsw/northern-rivers - qld/sunshine-coast - nsw/sydney - tas/tasmania - wa/western-australia Use all to download from all locations. -r SAVE_ROOT, --save_root SAVE_ROOT The root path you want to save your data to. Default root path is Inside-Airbnb-Australia.
许可
本仓库遵循 MIT 许可协议。




