five

euclid_q1

收藏
Hugging Face2025-09-05 更新2025-09-06 收录
下载链接:
https://huggingface.co/datasets/mwalmsley/euclid_q1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含天文图像和相关信息的综合数据集。每个样本包括一个图像以及该图像的天文坐标(赤经(ra)和赤纬(dec))、发布名称(release_name)、对象ID(object_id)、图块索引(tile_index)、分割映射ID(segmentation_map_id)、视星等亮度(flux_vis_1fwhm_aper)、分割区域(segmentation_area)和图像裁剪宽度(cutout_width_arcsec)。数据集分为训练集和测试集。

This is a comprehensive dataset containing astronomical images and their associated metadata. Each sample includes an image along with its corresponding astronomical coordinates (right ascension (ra) and declination (dec)), release name, object ID, tile index, segmentation map ID, visual magnitude brightness (flux_vis_1fwhm_aper), segmentation area, and cutout width in arcseconds (cutout_width_arcsec). The dataset is split into training and test sets.
创建时间:
2025-08-25
原始信息汇总

数据集概述

基本信息

  • 数据集地址:https://huggingface.co/datasets/mwalmsley/euclid_q1
  • 配置数量:7个

配置详情

配置1:tiny-v1-gz_arcsinh_vis_y

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • train:30.48 MB,3,048个样本
    • test:5.69 MB,758个样本
  • 下载大小:28.36 MB
  • 数据集大小:28.75 MB

配置2:v1-gz_arcsinh_vis_lsb

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • test:780.18 MB,76,061个样本
    • train:3.04 GB,304,050个样本
  • 下载大小:3.81 GB
  • 数据集大小:3.80 GB

配置3:v1-gz_arcsinh_vis_only

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • train:2.26 GB,304,050个样本
    • test:579.30 MB,76,061个样本
  • 下载大小:2.83 GB
  • 数据集大小:2.82 GB

配置4:v1-gz_arcsinh_vis_y

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • train:2.40 GB,303,998个样本
    • test:592.49 MB,76,113个样本
  • 下载大小:5.84 GB
  • 数据集大小:2.97 GB

配置5:v1-sw_mtf_vis_y

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • train:1.67 GB,303,998个样本
    • test:422.81 MB,76,113个样本
  • 下载大小:4.02 GB
  • 数据集大小:2.08 GB

配置6:v2-gz_arcsinh_triple

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • train:2.02 GB,317,994个样本
    • test:500.31 MB,79,484个样本
  • 下载大小:2.42 GB
  • 数据集大小:2.50 GB

配置7:v2-gz_arcsinh_vis_y

  • 特征:id_str(字符串)、image(图像)、ra(float64)、dec(float64)、release_name(字符串)、object_id(字符串)、tile_index(字符串)、segmentation_map_id(字符串)、flux_vis_1fwhm_aper(float64)、segmentation_area(int64)、cutout_width_arcsec(float64)
  • 数据划分
    • test:617.97 MB,79,486个样本
  • 下载大小:605.65 MB
  • 数据集大小:617.97 MB
搜集汇总
数据集介绍
main_image_url
构建方式
在宇宙学观测研究领域,euclid_q1数据集通过欧几里得太空望远镜采集的多波段天文图像构建而成。其处理流程涵盖原始数据的预处理、天体目标的切割与标注,并应用了反双曲正弦变换等图像增强技术以优化视觉特征。数据集依据不同观测条件与处理参数划分为多个子集,每个子集均包含天体坐标、流量测量及分割区域信息,确保了数据结构的规范性与科学性。
特点
该数据集的核心特点在于其多配置架构,涵盖可见光与多波段融合数据,并区分训练与测试子集以支持机器学习任务。每个样本集成图像数据与元数据,包括赤经赤纬坐标、天体标识符及流量参数,为宇宙学建模提供丰富特征。数据规模庞大,部分子集样本量逾30万,且均经过标准化处理,保障了数据的一致性与可比性。
使用方法
研究者可通过HuggingFace平台直接加载指定配置的子集,例如调用v1-gz_arcsinh_vis_y配置以获取经增强处理的可见光数据。数据集支持标准图像处理流程,适用于天体分类、形态分析或光度测量等任务。其结构化设计允许用户依据ra、dec等元数据快速检索样本,或结合segmentation_map_id进行精细的天体分割研究。
背景与挑战
背景概述
euclid_q1数据集源于欧洲空间局欧几里得太空望远镜项目,该项目旨在通过高精度光学成像探索暗能量与暗物质的宇宙学本质。数据集由欧空局联合多个国际研究机构于2020年代初期构建,核心研究聚焦于星系形态分类与弱引力透镜测量,为理解宇宙加速膨胀机制提供了关键的多波段天文图像数据。该数据集通过标准化处理流程整合了可见光与近红外观测数据,显著推动了计算天文学与机器学习在宇宙学研究中的交叉应用。
当前挑战
该数据集致力于解决星系形态自动分类中的低表面亮度天体检测难题,其挑战在于区分邻近星系的空间重叠结构与微弱信号的天体特征。构建过程中需克服观测数据的多波段配准误差、宇宙射线噪点剔除以及像素级分割的一致性验证问题。此外,大规模天文图像的存储与分布式处理对计算架构提出了极高要求,需平衡数据精度与存储效率的矛盾。
常用场景
经典使用场景
在星系形态学研究中,euclid_q1数据集凭借其高质量的天体图像和精确的测光参数,成为训练深度学习模型进行星系自动分类的经典资源。该数据集通过提供标准化的可见光波段图像及对应的流量测量值,使研究人员能够构建卷积神经网络,有效识别旋臂结构、椭圆星系特征以及特殊天体形态,为大规模巡天数据的高效处理奠定基础。
实际应用
在欧几里得太空望远镜的地面数据处理系统中,该数据集被用于开发自动化星系检测流水线,显著提升海量天文数据的处理效率。其标注信息可辅助构建实时天体目标筛选系统,为时域天文学中的瞬变现象监测提供候选目标,同时支撑虚拟天文台的数据可视化平台开发。
衍生相关工作
基于该数据集衍生的经典工作包括Galaxy Zoo系列公民科学项目中的卷积神经网络分类器,以及《皇家天文学会月报》多项关于低表面亮度星系检测的研究。其数据格式更成为LSST等下一代巡天项目设计数据标准的参考范本,推动了多波段数据融合算法的创新发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作