Enhancing Gravitational-wave Astronomy with AI Techniques

基于人工智能技术的引力波数据分析前沿

天文信息学与虚拟天文台 2022 年学术年会

2023年4月20日 15:45-16:00

王赫

hewang@ucas.ac.cn

中国科学院大学 · 国际理论物理中心(亚太地区)

on behalf of the LIGO-Virgo-KAGRA Collaboration

  • 引力波天文学
  • 人工智能与引力波数据处理
    • 引力波信号探测
    • 引力波数据降噪
  • 未来展望与规划

目录

引力波天文学

  • 引力波是广义相对论中的一种强场效应

    • 2015年:首次实验探测到双黑洞并合引力波

    • 2017年:首次双中子星多信使探测,开启多信使天文学时代

    • 2017年:引力波探测成果被授予诺贝尔物理学奖

    • 至今:发现了超过 90 个引力波事件

  • 未来:

    • 2023-2024年:有希望探测更多不同类型的引力波事件

    • 空间引力波探测计划 (LISA/Taiji/Tianqin) + XG (CE/ET)

地面引力波探测器网络

2017 年诺贝尔物理学奖

双星并合系统产生的引力波波源

引力波振幅的测量

引力波天文学

  • 伯纳德·舒尔茨曾列出成功观测引力波的五条关键要素:
    1. 良好的探测器技术
    2. 良好的波形模板
    3. 良好的数据分析方法和技术
    4. 多个独立探测器间的一致性观测
    5. 引力波天文学和电磁波天文学的一致性观测

​​DOI:10.1063/1.1629411

  • 基础理论的检验与修正
    • 基础物理学
      • 引力子是否有质量, 引力波的传播速度 ...
    • 天体物理学
      • 大质量恒星演化模型, 恒星级双黑洞的形成机制 ...
    • 宇宙学
      • 哈勃常数的测量, 暗能量 ...

首次探测双黑洞并合引力波事件 GW150914

引力波天文学与人工智能

  • 基于数据驱动机器学习技术的引力波数据分析方向成为新的研究热点

  • 通过机器学习算法对大规模引力波数据进行分析和处理,可以更加准确地识别引力波信号以及实现引力波波源参数反演
  • 机器学习技术还可以帮助引力波研究人员深入研究宇宙中的各种现象和物理规律,推动引力波天文学的发展
  • 深度学习技术应用在引力波科学数据处理流程各个环节:

    • 数据质量提升:对非高斯短时脉冲噪声的抑制 (deglitch)

    • 波形建模:快速生成理论精确模版

    • 信号搜寻:快速准确识别引力波信号

    • 波源参数反演:快速准确的后验概率分布估计

Data quality improvement

Credit: Marco Cavaglià 

LIGO-Virgo 数据处理流程

GW waveform modeling

GW searches

Astrophsical interpretation of GW sources

引力波天文学与人工智能

  • 地面引力波探测科学数据的特点

    • ​噪声特点:非高斯 + 非稳态

    • 信号特点:信噪比低
      (约噪声幅度的1/100,-60 dB)

引力波天文学与人工智能:信号探测

PRL, 2018, 120(14): 141103.

  • 匹配滤波方法 (Matched filtering)

    • ​高斯稳态噪声环境下,提取信号的最优线性算法

    • 从信号处理角度理解:

      • 输入:某一段时域数据

      • 输出:另一段时序数据 (探测统计量,即匹配滤波信噪比)

      • 求解:怎样的线性滤波器可以使得输出结果最大?

  • 原理验证阶段,卷积神经网络可以实现与传统数据处理方法相比拟的性能,在执行速度方面完胜(GPU加持)
  • 许多研究者从不同的角度和问题出发,验证在高斯稳态噪声和模拟的理论波形下,卷积神经网络的优异性能。

PRD, 2018, 97(4): 044039. ​​​​​​​

引力波天文学与人工智能:信号探测

Convolutional Neural Network (ConvNet or CNN)

  • 将 CNN 模型在真实噪声和真实引力波事件上测试,效果很糟糕 😰

Matched-filtering Convolutional Neural Network (MFCNN)

GW150914

GW151012

MFCNN
MFCNN

GPS 时间轴

GW150914

GW151012

GPS 时间轴

Wang H, et al. PRD (2020)

引力波天文学与人工智能:信号探测

Matched-filtering Convolutional Neural Network (MFCNN)

  • 改进并开发神经网络模型,以适应真实的引力波观测数据的任务
  • 匹配滤波算法当中的波形模板 \(\rightarrow\) 卷积层中的卷积核权重参数
  • 匹配滤波感知层 (matched-filtering layer)
  • 可以准确探测到 GWTC-1 中的 11 个真实引力波事件,甚至包括 GW170817
  • 引力波信号处理 \(\rightarrow\) 智能引力波信号处理
GW170817
GW190412
GW190814

GW150914 的实时信号搜寻

GWTC-1/2 的参数空间分布

Wang H, et al. PRD (2020)

(MFCNN group) Wang H, et al. PRD (2023)

引力波天文学与人工智能:数据降噪

He Wang, et al. Intelligent noise suppression for gravitational wave observational data,
26 February 2023, PREPRINT (Version 1) available at Research Square.

DOI: 10.21203/rs.3.rs-2452860/v1

  • 引力波智能降噪与数据分析:

    • 引力波观测数据降噪模型:WaveFormer

    • 引力波暂现源事件信号搜寻

引力波天文学与人工智能:数据降噪

He Wang, et al. Intelligent noise suppression for gravitational wave observational data,
26 February 2023, PREPRINT (Version 1) available at Research Square.

DOI: 10.21203/rs.3.rs-2452860/v1

降噪前

降噪后

  • 引力波智能降噪与数据分析:

    • 引力波观测数据降噪模型:WaveFormer

    • 引力波暂现源事件信号搜寻

引力波天文学与人工智能:数据降噪

He Wang, et al. Intelligent noise suppression for gravitational wave observational data,
26 February 2023, PREPRINT (Version 1) available at Research Square.

DOI: 10.21203/rs.3.rs-2452860/v1

  • 引力波智能降噪与数据分析:

    • 引力波观测数据降噪模型:WaveFormer

    • 引力波暂现源事件信号搜寻

  • Billion-scale 大模型对全频段的引力波探测数据实现噪声去除和引力波信号的波形重构

  • Highlights:
    • 抑制观测​噪声幅度 (包括Glitch) 1-2 个数量级以上
    • 对引力波信号幅度和相位信息精确重构

引力波天文学与人工智能:数据降噪

  • 引力波智能降噪与数据分析:

    • 引力波观测数据降噪模型:WaveFormer

    • 引力波暂现源事件信号搜寻

  • Billion-scale 大模型对全频段的引力波探测数据实现噪声去除和引力波信号的波形重构

  • Highlights:
    • 抑制观测​噪声幅度 (包括Glitch) 1-2 个数量级以上
    • 对引力波信号幅度和相位信息精确重构

He Wang, et al. Intelligent noise suppression for gravitational wave observational data,
26 February 2023, PREPRINT (Version 1) available at Research Square.

DOI: 10.21203/rs.3.rs-2452860/v1

未来展望与规划

  • 能够快速地获取高质量、高精度且可靠的引力波科学数据都是至关重要的

  • 我国引力波数据分析基础薄弱,基础实施还不完善

  • 引力波数据的现状、需求与挑战:

    • 数据量庞大:>17.2TB

    • 技术门槛较高:CernVM-FS (1-5MB/s, 42-209 days)

    • 存储数据的平台非常多且散乱 (GitHub / GitLab / Zenodo / LIGO DCC / ...)

    • 数据格式缺乏统一的标准和规范,普遍缺乏说明性引导和可视化预览

  • NADC 青年数据科学家项目:

    • 以LIGO科学合作组织公开发布的引力波探测数据集引力波科学分析结果为基础,搭建引力波开放数据库数据源,对数据的一致性进行统一规范化整理。

    • 以国家天文科学数据中心在线服务平台,开发适用于引力波天文学研究的引力波探测开源数据门户

for _ in range(num_of_audiences):
    print('Thank you for your attention! 🙏')

未来展望与规划

  • 能够快速地获取高质量、高精度且可靠的引力波科学数据都是至关重要的

  • 我国引力波数据分析基础薄弱,基础实施还不完善

  • 引力波数据的现状、需求与挑战:

    • 数据量庞大:>17.2TB

    • 技术门槛较高:CernVM-FS (1-5MB/s, 42-209 days)

    • 存储数据的平台非常多且散乱 (GitHub / GitLab / Zenodo / LIGO DCC / ...)

    • 数据格式缺乏统一的标准和规范,普遍缺乏说明性引导和可视化预览

  • NADC 青年数据科学家项目:

    • 以LIGO科学合作组织公开发布的引力波探测数据集引力波科学分析结果为基础,搭建引力波开放数据库数据源,对数据的一致性进行统一规范化整理。

    • 以国家天文科学数据中心在线服务平台,开发适用于引力波天文学研究的引力波探测开源数据门户

Bonus Slides

  • 技术储备:

    • 曾设计并开发了DataSciComp门户网站

    • NoSQL非关系型的数据库

    • 前端Flask架构和Docker容器化技术

    • 后端架构是基于微服务 (Microservice Architecture) 技术

DataSciComp

  • 数据准备:

    • 已经采集完近 17.2TB 引力波探测数据,并收集了较为完整的各学术权威机构所发布的引力波科学数据结果

Bonus Slides

  • CKAN (开源数据管理系统): an open-source DMS (data management system) for powering data hubs and data portals.

  • Streamlit: 一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。

  • VisibleGWStrain: 可调取并可视化O1-O3任意一段时域数据的进行观察和提取,展示数据质量等相关信息。
  • VisibleGWaveform: 可生成并可视化不同理论波形模板描述下的引力波波形信息(时域、频域和时频域)。
  • VisibleGWevents: 可查询并可视化各类引力波暂现源星表(GWTC,OGC等)和对应波源参数反演的分析结果。

Bonus Slides

  • 预期研究成果

    1. 引力波探测数据治理手册

    2. 引力波探测开源数据门户

      • 开放数据获取 API 接口

      • 可交互式数据可视化应用

        • 引力波观测数据 (VisibleGWStrain)

        • 引力波模板波形 (VisibleGWaveform)

        • 引力波科学分析结果 (VisibleGWevents)

    3. 部分核心代码将会在开源平台Zenodo上以数字出版物的形式发布,并撰写软著

  • 潜在价值

    • 为我国引力波天文学数据处理领域的科研人员带来便利

    • 作为中国科学院”空间太极计划“科学数据平台的技术储备

    • 教学辅助和学术参考价值

    • 科普教育意义

Bonus Slides

  • 预期研究成果

    1. 引力波探测数据治理手册

    2. 引力波探测开源数据门户

      • 开放数据获取 API 接口

      • 可交互式数据可视化应用

        • 引力波观测数据 (VisibleGWStrain)

        • 引力波模板波形 (VisibleGWaveform)

        • 引力波科学分析结果 (VisibleGWevents)

    3. 部分核心代码将会在开源平台Zenodo上以数字出版物的形式发布,并撰写软著

  • 潜在价值

    • 为我国引力波天文学数据处理领域的科研人员带来便利

    • 作为中国科学院”空间太极计划“科学数据平台的技术储备

    • 教学辅助和学术参考价值

    • 科普教育意义