极紫外太阳图像去过曝光数据库
张鑫泽 于学鑫 徐龙
中国科学院国家天文台
极紫外太阳图像过曝光现象:
搭载在太阳动力学天文台(Solar Dynamics Observatory,SDO)[1]上的大气成像仪(Atmospheric Imaging Assembly,AIA)[2]由四个双通道标准入射的四个望远镜组成。为了监测太阳活动事件,它能够以高空间分辨率在7个极紫外波段(Extreme ultraviolet,EUV)、2个紫外波段和1个可见光波段同时捕获10张全是面太阳图像。
图1、SDO/AIA极紫外太阳图像的饱和现象(多个波段上的曝光、曝光原理)
然而,当太阳耀斑事件发生时,SDO/AIA在EUV波段观测图像出现饱和,导致了图1(右)中的衍射条纹和饱和现象。衍射条纹与AIA的点扩散函数(Point-spread function,PSF)有关。具体来说,PSF表示望远镜对于理想点源的系统响应。它由一个核心峰组件和随强度变化的规则的外围衍射组件构成。外围衍射组件能够复制中心峰并且导致图像中产生衍射条纹。在太阳耀斑发生时,衍射条纹在背景上的变得更加明显。饱和区域实际上包含两部分:(1)主饱和,它是由于强烈的入射粒子超过了电荷耦合装置(Charge-coupled device,CCD)的容量而引起的。(2)次饱和,它是由主饱和的过多的入射粒子流入到相邻像素导致的。对于强烈的入射太阳信号,一部分在CCD上持续累积直到饱和,而另一部分线性地扩散并产生了衍射条纹,并且衍射条纹的产生不受饱和区域的影响[3]。这个事实表明了主饱和区域丢失的信号可以从衍射条纹中找到[4][5]。
[1] Pesnell W D, Thompson B J, Chamberlin P C. The Solar Dynamics Observatory (SDO)[J]. The Solar Dynamics Observatory, 2012: 3
[2] Lemen J, Akin D, Boerner P, et al. The Atmospheric Imaging Assembly (AIA) on the Solar Dynamics Observatory (SDO)[J]. Solar Physics, 2012, 275.
[3] Guastavino S, Piana M, Massone A M, et al. Desaturating SDO/AIA observations of solar flaring storms[J]. The Astrophysical Journal, 2019, 882(2): 109.
[4] Schwartz R A, Torre G, Piana M. Systematic de-saturation of images from the atmospheric imaging assembly in the solar dynamics observatory[J]. The Astrophysical Journal Letters, 2014, 793(2): L23.
[5] Torre G, Schwartz R A, Benvenuto F, et al. Inverse diffraction for the atmospheric imaging assembly in the solar dynamics observatory[J]. Inverse Problems, 2015, 31(9): 095006.
极紫外太阳图像去过曝光数据库:
以SDO/AIA 193Å波段的极紫外图像为例,数据库创建的基本流程如下:
1)首先,从空间天气预报中心[1]下载了2010年到2017年的M级和X级的事件列表,并使用SunPy数据包中的联合数据获取器[2]下载事件列表中的193Å波段的全日面数据。
2)然后,从中挑选出相邻的长曝光和短曝光的数据对,并把这些数据依次利用软件Solar SoftWare中的“aia_prep.pro”程序进行预处理,曝光时间归一化处理和“log”函数变换处理,最终保存为8-bit精度的“png”格式的图像。处理后的长曝光和短曝光全日面图像对如图2中的ISAT_FD和IUNSAT_FD所示。
3)最后,从全日面图像中的活动区剪切出256×256大小的图像块,如图2中ISAT和IGT所示。

图2、数据库样本示例
在图2中,IM是对ISAT进行阈值计算得到的二值掩码,其中0代表饱和像素,1代表非饱和像素,退化图像IA是通过IGT⊙IM计算得到的模拟饱和图像。因此,一个去饱和数据集的样本是一个包含ISAT,IA,IM和IGT的四元组。值得注意的是,ISAT和IGT是来之两个图像源,而不是像传统的图像修复只涉及一个图像源。而且ISAT只是提供真实的饱和区域的形状,并不参与网络的训练,真正参与网络训练的图像是IA, IM和IGT。整个数据集总计1,8700个样本,本文按着时间顺序将2012–2017数据划分为训练集(约15700个样本),2010–2011为测试集(约3000个样本)。