Airbnb数据集|共享住宿数据集|数据分析数据集
收藏数据集概述
Q1 AirBnB搜索
- 目的: 显示波特兰, OR的住宿列表,包含名称、邻里、房间类型、容纳客人数量、物业类型和设施、每晚成本,以及未来两天的可用性,按评分降序排列。
- 查询: 使用MongoDB聚合框架,匹配城市为波特兰,日期在未来两天内,且可用的记录。通过
lookup
和unwind
操作连接listings
表,并按review_scores_rating
排序。最后通过project
操作选择需要的字段。
Q2 无房源的邻里
- 目的: 查找在任何城市中没有任何房源的邻里。
- 查询: 使用MongoDB聚合框架,通过
lookup
操作将neighborhoods
表与listings
表连接,匹配listings
为空数组的记录,并选择邻里和城市字段。
Q3 预订可用性
- 目的: 对于塞勒姆的“整套房子/公寓”类型房源,提供每月的可用性估计,显示房源名称、是否为整套房子/公寓、月份、可用时间段(或单日,如果最小住宿夜数为1),以及最小夜数。
- 查询: 使用MongoDB聚合框架,匹配房间类型为“整套房子/公寓”且城市为塞勒姆的记录。通过
lookup
和unwind
操作连接Calendar
表,提取日期组件,并进行复杂的逻辑处理以确定可用性。
Q4 春季与冬季的预订趋势
- 目的: 对于波特兰的“整套房子/公寓”类型房源,提供今年春季和冬季每月的可用性估计。
- 查询: 使用MongoDB聚合框架,匹配房间类型为“整套房子/公寓”且城市为波特兰的记录,并进一步筛选月份在1到6之间的记录。通过
lookup
和unwind
操作连接Calendar
表,提取日期组件,并进行复杂的逻辑处理以确定可用性。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录