Strange Places v5.2 - Real-World Mysterious Phenomena
收藏github2026-02-09 更新2026-02-11 收录
下载链接:
https://github.com/lukeslp/strange-places-dataset
下载链接
链接失效反馈官方服务:
资源简介:
354,770条来自NASA、NOAA、USGS、BFRO、NUFORC、OpenStreetMap、Megalithic Portal和Shadowlands Haunted Places Index的地理参考神秘现象记录。所有记录均来自权威数据库,无合成数据。
本数据集共收录354,770条地理参照型神秘现象记录,数据来源涵盖美国国家航空航天局(National Aeronautics and Space Administration,NASA)、美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)、美国地质调查局(United States Geological Survey,USGS)、BFRO、不明飞行物报告中心(National UFO Reporting Center,NUFORC)、开放街道地图(OpenStreetMap)、Megalithic Portal以及暗影之地闹鬼地点索引(Shadowlands Haunted Places Index)。所有记录均源自权威数据库,未包含任何合成数据。
创建时间:
2026-01-21
原始信息汇总
Strange Places v5.2 数据集概述
基本信息
- 数据集名称:Strange Places v5.2 - Real-World Mysterious Phenomena
- 记录数量:354,770 条
- 数据类别:14 类
- 数据格式:JSON
- 数据划分:train (354,770 条示例)
- 许可协议:CC BY 4.0
- 语言:英语 (en)
- 任务类别:特征提取 (feature-extraction)
- 规模分类:100K<n<1M
数据内容与特征
数据集包含全球范围内 354,770 条地理参考的神秘现象记录,所有数据均来自权威数据库,无合成数据。
- 地理坐标有效性:99.9% 的记录具有有效坐标 (354,544 条)。
- 数据平衡性:最大类别占比 20%。
- 覆盖范围:全球。
- 数据特征:
category(string): 现象类别。latitude(float64): 纬度。longitude(float64): 经度。name(string): 名称。description(string): 描述。date(string): 日期。
数据类别与来源
| 类别 | 数量 | 数据来源 |
|---|---|---|
| Tornadoes | 71,813 | NOAA |
| Caves | 70,242 | OpenStreetMap |
| UFO Sightings | 60,632 | NUFORC |
| Megalithic Sites | 60,028 | Megalithic Portal |
| Meteorite Landings | 32,186 | NASA |
| Ghost Towns | 18,154 | OpenStreetMap |
| Storm Events | 14,770 | NOAA |
| Haunted Places | 9,717 | Shadowlands Index |
| Thermal Springs | 5,003 | NOAA |
| Bigfoot Sightings | 3,797 | BFRO |
| Earthquakes | 3,742 | USGS |
| Shipwrecks | 3,653 | NOAA |
| Fireballs | 863 | NASA |
| Volcanoes | 170 | USGS |
来源与许可
| 来源 | 涉及类别 | 许可协议 |
|---|---|---|
| NASA | Meteorites, Fireballs | Public Domain |
| NOAA | Tornadoes, Storms, Springs, Shipwrecks | Public Domain |
| USGS | Earthquakes, Volcanoes | Public Domain |
| OpenStreetMap | Caves, Ghost Towns | ODbL 1.0 |
| Megalithic Portal | Megalithic Sites | Attribution |
| NUFORC | UFO Sightings | Fair Use |
| BFRO | Bigfoot Sightings | Fair Use |
| Shadowlands Index | Haunted Places | Fair Use |
版本历史
- v5.2 (2026-02):新增大脚怪目击事件 (BFRO, 3,797条) 和闹鬼地点 (Shadowlands, 9,717条)。共 354K 条记录,14 个类别。
- v5.1 (2026-01):移除了瀑布数据(独立数据集),共 341K 条记录。
- v5.0 (2025-12):新增风暴事件、温泉数据。
- v4.0 (2025-11):初始版本。
相关资源
- 数据集主页:https://github.com/lukeslp/strange-places-dataset
- HuggingFace:https://huggingface.co/datasets/lukeslp/strange-places-mysterious-phenomena
- Kaggle:https://www.kaggle.com/datasets/lucassteuber/strange-places-mysterious-phenomena
- 数据目录:https://dr.eamer.dev/datavis/data_trove/
- 作者主页:https://lukesteuber.com
搜集汇总
数据集介绍

构建方式
在地球科学与神秘现象研究的交叉领域,Strange Places v5.2 数据集通过系统整合来自多个权威机构的公开数据构建而成。其构建过程严格遵循数据采集与融合的科学原则,从美国国家航空航天局、美国国家海洋和大气管理局、美国地质调查局等官方机构,以及大脚怪研究组织、国家不明飞行物报告中心等专业数据库中提取原始记录。所有数据均经过地理坐标验证与标准化处理,确保超过99.9%的记录具备有效的经纬度信息,最终形成包含35万余条真实观测记录的综合性数据集。
特点
该数据集以其广泛的类别覆盖与全球空间分布为显著特征,囊括了龙卷风、洞穴、不明飞行物目击、巨石遗址等14类神秘现象,各类别数据量分布均衡,最大类别占比控制在20%以内。每条记录均包含类别、经纬度、名称、描述与日期等结构化字段,实现了自然现象与超常现象的统一表征。数据集的时间跨度从20世纪中期延续至2026年,空间范围覆盖全球各大洲,为地理空间分析与跨现象比较研究提供了多维度的数据基础。
使用方法
在应用层面,该数据集支持通过标准JSON格式进行加载与处理,研究者可使用Python等编程语言对数据进行分类筛选与空间分析。例如,通过类别字段可快速提取特定现象的子集,结合经纬度信息可实现地理可视化或空间聚类研究。数据集已成功应用于交互式地图构建与现象分布模式探索,为地球科学、人文地理及数据可视化领域的跨学科研究提供了可靠的数据支撑。用户可通过Hugging Face或Kaggle平台获取完整数据集,并遵循CC BY 4.0许可协议进行学术使用与二次开发。
背景与挑战
背景概述
在数据科学与地理信息交叉领域,对全球范围内神秘现象的系统性记录与分析长期面临数据分散与标准缺失的困境。Strange Places v5.2数据集由研究者Luke Steuber于2025年12月初步构建,并于2026年2月更新至包含14个类别的版本。该数据集整合了来自NASA、NOAA、USGS等权威机构以及NUFORC、BFRO等民间组织的公开数据,旨在为地球科学、考古学乃至超自然现象研究提供一个统一、可验证的地理参照数据源。其核心研究问题聚焦于如何通过大规模、多源异构的地理空间数据,揭示自然与人文神秘事件在全球的分布模式与潜在关联,为跨学科的空间分析与模式识别研究奠定了重要基础。
当前挑战
该数据集致力于解决地理空间神秘现象的多类别统一表征与模式发现这一复杂问题,其挑战首先体现在领域问题的内在复杂性:不同类别现象(如UFO目击与地震)在数据生成机制、时空尺度与可信度上存在显著差异,为构建一致的时空分析框架带来困难。在构建过程中,挑战主要源于多源数据的异构性整合,需协调来自政府公开数据、民间组织记录与开放地图项目在坐标精度、描述规范与许可协议上的不一致;同时,确保超过35万条记录的坐标有效性(达99.9%)与全球覆盖的平衡性,亦需克服数据清洗、去重与地理编码的巨大工作量。
常用场景
经典使用场景
在地球科学与地理信息领域,Strange Places v5.2数据集为研究者提供了全球范围内神秘现象的标准化地理参照数据。该数据集最经典的使用场景在于支持跨类别空间分布分析,例如通过整合UFO目击、大脚怪报告与自然灾害事件的地理坐标,研究人员能够探索不同现象之间的空间关联性,揭示潜在的地理模式或异常集群。这类分析常借助地理信息系统(GIS)工具进行可视化与统计检验,为神秘现象研究提供了实证基础。
解决学术问题
该数据集有效解决了神秘现象研究中数据分散与标准化不足的学术难题。通过聚合来自NASA、NOAA、USGS等权威机构的14类数据,它使得研究者能够系统性地检验超自然传说与自然事件之间的时空相关性,例如分析地震活动区是否与灵异事件报告存在地理重叠。这种整合促进了跨学科研究,将地球科学、考古学与民俗学连接起来,为理解人类对未知现象的认知与记录模式提供了可靠的数据支撑。
衍生相关工作
基于该数据集衍生的经典工作包括多项交互式数据可视化项目,例如《Keep Looking》与《Strange Places Explorer》。这些作品通过诗意地图与动态界面,将UFO目击、大脚怪踪迹等数据转化为公众可探索的叙事体验,推动了数据艺术与科学传播的融合。此外,研究者利用其地理编码特征开发了空间聚类算法,用于识别神秘现象的热点区域,相关方法已延伸至环境异常检测与文化遗产保护研究中。
以上内容由遇见数据集搜集并总结生成



