1959年,苏联的luna-1号卫星上天,人类首次得以对太阳风进行就地观测。此后数十年的观测和研究表明,近地太阳风有着不同的特性,起源于不同的源区。太阳风可大致分为四类:冕洞风、冕流风、扇区反转区风和日冕抛射风。
根据源区对太阳风进行分类对于太阳和日球物理研究有着重要意义。首先,为了对太阳风性质进行更全面准确的了解,在统计研究时需要对太阳风类型加以区分;其次,太阳风在行星际传播时仍“记录”着其源区的一些特征,分类研究有助于更好地了解发生在太阳不同区域的物理过程;再次,不同类型太阳风的对地效应显著不同,太阳风分类信息也有望提升空间天气预警效果。
传统上,太阳风分类是由一些经验丰富的研究人员综合不同种类的众多观测特征来完成的。比如,依据不同的观测特征,众多研究人员分别整理发布了行星际日冕物质抛射事件列表、磁云列表、共转相互作用区列表、激波事件列表、日球层电流片列表、日球扇区边界列表等。此外,学者们也尝试开发一些太阳风分类的经验模型。比如,一维参数空间的经验模型(太阳风速度vp、ptype)、二维参数空间的经验模型(o7 /o6 - vp)、三维参数空间的经验模型(sp-va-texp/tp)等。
近十年来,太阳风分类识别取得了很大进展。尽管如此,不论是人工识别还是经验模型识别,都存在一定的局限性。在面对浩繁的观测数据时,人工识别的标准不一且难以做到实时更新,比如权威的lepping磁云列表从2008年开始就停止更新了,其他一些列表也存在不同程度的更新滞后现象。对于经验模型而言,由于经常需要人工介入难以真正做到全自动化。另外,为了便于明晰识别界面,经验模型都是在三维或以下参数空间来开展,在识别准确度上还有提升空间。
最近,技术得到了长足进步,算法开始取代一些需要人工介入的工作。多参数空间的分类算法作为的典型任务,面对空间物理大数据时代,其在模式识别领域的优势逐步凸显,因而逐渐流行起来。在此背景下,中国科学院国家空间科学中心天气室研究员李晖、王赤与南京信息工程大学副教授许飞展开识别太阳风分类的合作研究。团队利用国际流行的10种分类算法(knn、lsvm、rbfsvm、dt、rf、adaboost、nn、gnb、qda、xgboost)在优选后的8维参数空间中开发了太阳风分类的自动识别算法,可以自动、快速地将太阳风观测数据分为冕洞风、冕流风、扇区反转区风和日冕抛射风四类,图1展示了其中的一个事例。
常见的分类算法大都能得到不错的分类结果,其中knn算法的分类准确度分别为99.2%、91.1%、83.8%和92.9%。相比此前最好的经验模型,准确度分别提升了2.3%、21.2%、11.8%和5.4%;该太阳风分类算法可以识别出行星际小尺度通量绳(仅持续数小时),为后续太阳风小尺度结构特性及其与背景太阳风相互作用的研究提供便利;在此基础上,通过对比研究,团队还证实了实时太阳风分类信息可以应用于空间天气预警。如表1所示,当卫星实时监测到一个较强的太阳风电场(ey > 5.0 mv/m)时,如果太阳风分类算法判定由冕流风所携带的话,那么引发中等磁暴的概率较大并伴随较高的卫星充电风险;如果判定由日冕抛射风所携带的话,那么引发强磁暴的概率较大并伴随较低的卫星充电风险。
该项研究证实了基于的分类算法有能力高效而准确地识别出四种典型类型的太阳风,可以获得比以往经验模型更好的分类效果。此外,该分类算法仅需要一些基本的太阳风参量观测,如等离子体数密度、温度、速度、磁场强度。无需太阳风成分观测的特点也使得该算法有更高的适用性和更广阔的应用前景。
目前,该工作已发表于美国地球物理学会旗下的earth and space 期刊。
图1:太阳风分类的效果(彩色竖条是人工识别的太阳风分类,彩色点是算法的结果)
表1:太阳风分类信息在空间天气预警中的应用