ScenicOrNot_Uncompressed_Feb26
收藏Hugging Face2026-02-16 更新2026-02-17 收录
下载链接:
https://huggingface.co/datasets/ddecosmo/ScenicOrNot_Uncompressed_Feb26
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含211,855个训练样本,总大小约24GB,采用CC许可协议。数据特征包含11个字段:唯一标识符(id)、网格图像ID(gridimage_id)、地理坐标(lat/lon)、数值统计量(average/variance)、投票信息(votes)、标题(title)、图像采集时间(imagetaken)、原始图像数据(image)以及索引字段(__index_level_0__)。数据集专为包含空间坐标和图像元数据的任务设计,可能适用于地理空间分析、图像属性回归或计算机视觉与地理信息的交叉研究。
创建时间:
2026-02-14
搜集汇总
数据集介绍
构建方式
在景观美学与地理信息交叉领域,ScenicOrNot_Uncompressed_Feb26数据集通过众包方式系统构建。其基础图像源自Geograph英国与爱尔兰项目,覆盖大不列颠境内的多样化户外场景。每幅图像由至少三名志愿者依据美学标准进行独立评分,分值范围设定为1至10分,分别对应“非风景性”与“极具风景性”两极。评分过程产生的原始投票数据经过统计处理,衍生出平均分值与方差指标,并与图像的地理坐标、拍摄日期等元数据整合,形成结构化记录。
特点
该数据集的核心特征在于其多维度的景观美学标注与丰富的地理上下文信息。图像以未压缩格式保存,确保了视觉细节的完整性,便于高精度计算分析。每条数据不仅包含众包得出的平均风景评分,还提供了评分方差,用以反映审美一致性,为研究主观评价的离散性提供了量化依据。地理坐标字段支持空间分析与区域景观模式挖掘,而标题与拍摄日期则增添了描述性与时序维度,使得数据集能够服务于视觉美学计算、地理信息系统以及文化景观研究等多重领域。
使用方法
使用该数据集时,可借助其结构化字段开展多种计算任务。对于图像分类或回归研究,可直接以‘image’字段作为输入,以‘average’字段作为连续型风景评分标签,或将其离散化为类别进行美学等级预测。地理坐标‘lat’与‘lon’可用于空间可视化或与外部地理数据集进行关联分析,探索景观价值与地形、土地利用等因素的相关性。‘variance’字段有助于评估模型在意见分歧样本上的鲁棒性。在应用过程中,需遵循CC BY-SA许可协议,对Geograph平台的原始摄影师及华威大学数据科学实验室给予明确署名。
背景与挑战
背景概述
ScenicOrNot_Uncompressed_Feb26数据集诞生于英国地理景观美学评估的研究需求,由华威大学商学院数据科学实验室与Geograph英国及爱尔兰项目合作构建。该数据集通过众包方式收集了英国境内大量户外景观图像及其美学评分,旨在量化自然与人文景观的视觉吸引力。其核心研究问题聚焦于探索景观美学与地理空间特征之间的关联,为环境心理学、区域规划及计算机视觉领域提供了宝贵的实证数据。自创建以来,该数据集已成为景观美学计算研究的重要基准,推动了基于视觉内容的场景理解与地理信息系统的交叉应用。
当前挑战
该数据集致力于解决景观美学自动评估这一复杂问题,其挑战在于美学感知具有高度主观性,众包评分中个体差异显著,导致模型需处理评分方差较大的噪声数据。构建过程中,挑战主要体现于众包数据质量的把控,包括确保评分者的一致性、避免评分偏差,以及整合分散的地理图像与元数据。此外,图像采集条件各异,光照、季节与视角的变化进一步增加了模型泛化的难度,要求算法能够从非标准化视觉输入中提取稳健的美学特征。
常用场景
经典使用场景
在计算机视觉与地理信息科学交叉领域,ScenicOrNot_Uncompressed_Feb26数据集常被用于风景美学评估模型的训练与验证。该数据集通过众包方式收集了英国境内大量户外景观图像及其对应的美学评分,为研究者提供了丰富的视觉-评分配对样本。经典应用场景包括构建回归模型,以预测图像的美学得分,或开发分类系统,将景观按审美价值进行层级划分。这些工作通常利用深度学习架构,如卷积神经网络,从图像中提取视觉特征,并与人类主观评分建立映射关系,从而自动化地评估风景的视觉吸引力。
解决学术问题
该数据集有效解决了风景美学量化这一长期存在的学术挑战。传统上,景观美学评估依赖于专家主观判断,难以大规模应用。ScenicOrNot通过众包评分机制,将主观审美转化为可计算的连续数值,为美学计算提供了标准化基准。它促进了视觉美学计算模型的发展,使研究者能够探索自然场景中色彩、构图、纹理等视觉属性与人类审美偏好之间的关联。此外,结合地理坐标数据,该数据集支持跨学科研究,如环境心理学与景观规划,探讨地域特征如何影响审美感知,推动了数据驱动的景观研究范式转变。
衍生相关工作
围绕ScenicOrNot数据集,已衍生出多项经典研究工作。早期研究集中于风景评分预测模型的构建,例如采用卷积神经网络进行端到端回归,验证了视觉特征与美学得分的相关性。后续工作拓展至多模态分析,结合图像与地理元数据,探索空间分布对审美的影响,产生了基于地理加权回归的景观美学图谱。此外,该数据集启发了跨文化审美比较研究,通过对比不同地区的评分模式,揭示审美偏好的地域差异性。这些衍生工作不仅丰富了计算美学领域,也为地理信息系统与计算机视觉的融合提供了范例,持续推动着相关学科的交叉创新。
以上内容由遇见数据集搜集并总结生成



