Airbnb Dataset|Airbnb数据集|数据分析数据集
收藏Airbnb数据分析项目
概述
本项目涉及使用SQL和Python分析一个包含100,000条记录的合成Airbnb数据集。分析重点在于从价格、房产类型、评价分数和不同城市的可用性等方面提取关键见解,旨在帮助房东和客人做出明智的决策。
数据集描述
数据集包含以下列:
- Listing ID: 每个房源的唯一标识符。
- Host ID: 每个房东的唯一标识符。
- Host Name: 房东的姓名。
- Neighborhood: 房源所在地区或区域。
- City: 房产所在城市。
- Property Type: 房产类型(例如,公寓、房屋、别墅、公寓)。
- Room Type: 房间类型(例如,整套房源、独立房间、合住房间)。
- Price: 每晚价格(美元)。
- Minimum Nights: 预订所需的最少晚数。
- Number of Reviews: 客人留下的评论数量。
- Review Scores Rating: 平均评分分数。
- Availability: 未来365天内的可用天数。
关键见解
- 按平均价格排序的城市: 识别平均每晚价格最高的城市。
- 常见的房产类型: 展示不同城市中最常见的房产类型。
- 评价分数分析: 检查拥有超过100条评论的房产的平均评价分数。
- 按价格区间划分的房间类型: 按不同价格类别分解房间类型的分布。
- 房东分析: 突出拥有最多房源的房东及其平均评价分数。
未来工作
- 通过预测模型扩展分析: 开发预测模型,根据历史数据和其他相关特征预测价格趋势。
- 将发现整合到交互式仪表板中: 使用Power BI或Tableau等工具创建交互式仪表板,以动态方式展示见解和预测,提供探索和理解数据的新方式。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录