引力波数据分析

—— 算法、机器学习、人工智能

  • 我是谁
  • 很 low 的码农?股票分析师?
  •  
  • 引力波天文学科学家
  • 数据科学家
  • 人工智能算法工程师
  • 就业前景
  • 引力波数据分析的挑战

王赫 He Wang,
中国科学院大学E系列副研究员,LIGO-VIRGO-KAGRA 科学合作组成员。2020 年博士毕业于北京师范大学物理系理论物理专业,2020-2022 年于中国科学院理论物理研究所从事博士后研究,2021-2022 年赴鹏城国家实验室担任访问学者,2022-2024年为国科大国际理论物理中心(亚太地区)特别研究助理,2022 年获国家天文科学数据中心青年数据科学家称号。在OpenReview.net上对NeurIPS、ICML、ACL等多个AI顶会和AI4Science Workshop审稿,并受邀担任PLB, MLST等知名期刊的审稿人;《天文技术与仪器(英文)》(Astronomical Techniques and Instruments,ATI)青年编委。

GitHub: github.com/iphysresearch

Blog:IPhysResearch.github.io

Teaching

  • Jan 2024 |《引力波数据探索:编程与分析实战训练营》太极实验室线上培训
  • Aug 2023 | 引力波暑期学校《引力波数据处理与机器学习》:中山大学天琴中心
  • Jan 2022 - May 2022 |《数据可视化初了解》:知乎盐选
  • Apr 2021 – Jul 2021 | 人工智能从业者认证课程:腾讯云·课程开发
  • Dec 2020 – Jul 2021 |《深度学习之 PyTorch 实战》:万⻔大学
  • Jun 2020 – Nov 2020 |《Python 数据可视化与实战》:万⻔大学
  • Apr 2020 – Oct 2020 |《大数据预处理》国家开放大学 · 大数据挖掘与技术系列课程
  • Feb 2020 – Nov 2020 |《Python 程序设计》国家开放大学 · 大数据挖掘与技术系列课程
  • Aug 2019 |《Python 数据挖掘工具》中原银行 · 校招生培训系列课程

初次见面,

请多关照!

我是谁?

王赫,
LIGO-VTRGO-KAGRA 科学合作组成员。2020 年博士毕业于北京师范大学物理系,2020-2022 年于中科院理论物理研究所从事博士后研究,2021-2022 年赴鹏城实验室担任访问学者,2022 年至今为国科大国际理论物理中心(亚太地区)特别研究助理,2022 年获国家天文科学数据中心青年数据科学家称号。

目前主要从事引力波数据分析、引力检验以及数据处理技术(AI)相关的理论建模和算法开发工作。

我是做什么的?

Data quality improvement

Credit: Marco Cavaglià 

LIGO-Virgo data processing

GW searches

Astrophsical interpretation of GW sources

双星并合系统产生的引力波波源

引力波振幅的测量

引力波数据分析?

程序猿?

数据分析师?

运维工程师?

引力波数据分析!

引力波物理科学家

数据科学家

人工智能
算法工程师

引力波天文学

Gravitational-wave astronomy is a subfield of astronomy concerned with the detection and study of gravitational waves emitted by astrophysical sources.

引力波天文学

  • 爱因斯坦于1916年提出广义相对论,并预言了引力波的存在
  • 引力波是广义相对论中的一种强场效应
    • 2015年:首次实验探测到双黑洞并合引力波
    • 2017年:首次双中子星多信使探测,开启多信使天文学时代
    • 2017年:引力波探测成果被授予诺贝尔物理学奖
    • 至今:发现了超过 90 个引力波事件
  • 2024年:中国科学院大学加入地面引力波实验LIGO科学合作组织,
    成为LIGO目前在中国大陆地区的第二家成员单位​。
  • 未来规划:
    • 2024-2025年:有希望探测到更多不同类型的引力波事件
    • 空间引力波探测计划 (LISA/Taiji/Tianqin) + XG (CE/ET)

LIGO-VIRGO-KAGRA network

Gravitational waves generated by binary black holes system

GW detector

引力波天文学

  • 引力波探测打开了探索宇宙的新窗口

  • 不同波源,频率跨越 20 个数量级,不同探测器

  • 多信使天文学

引力波天文学

  • 基础理论的检验与修正
    • 基础物理学
      • 引力子是否有质量, 引力波的传播速度 ...
    • 天体物理学
      • 大质量恒星演化模型, 恒星级双黑洞的形成机制 ...
    • 宇宙学
      • 哈勃常数的测量, 暗能量 ...

​​​

  • The current clouds over fundamental physics:
    • 量子力学与广义相对论的统一
    • 星系旋转曲线(暗物质)、宇宙加速膨胀(暗能量)
    • 哈勃常数H0
    • 中微子震荡和质量问题
    • ...

引力波天文学与数据处理

  • 伯纳德·舒尔茨曾列出成功观测引力波的五条关键要素:
    1. 良好的探测器技术
    2. 良好的波形模板
    3. 良好的数据分析方法和技术
    4. 多个独立探测器间的一致性观测
    5. 引力波天文学和电磁波天文学的一致性观测

​​DOI:10.1063/1.1629411

©Floor Broekgaarden (repo)

The first GW event of GW150914

引力波天文学与数据处理

引力波观测数据

  • ​噪声: 非高斯 + 非稳态

 

 

 

 

 

 

  • (地面引力波探测) 信噪比极低,通常约为噪声幅度的1/100(-60分贝)

  • (空间引力波探测) 在任务观测期间接收到的所有引力波信号的叠加(例如:\(10^4\)  个双星黑洞系统,\(10\sim10^2\) 个超大质量黑洞,以及\(10\sim10^3\) 个极端质量比旋近系统等)。

LISA / Taiji project

匹配滤波方法

  • 高斯稳态噪声环境下,提取信号的最优算法

  • 假设:引力波观测数据 =
    高斯稳态噪声 + 某引力波信号

            \(d(t) = n(t) + h(t)\)

LIGO-VIRGO-KAGRA

引力波数据处理
与人工智能

Gravitational Wave Data Analysis and Artificial Intelligence

  • 2016年,AlphaGo 第一版发表在了 Nature 杂志上

  • 2021年,AI预测蛋白质结构登上 Science、Nature 年度技术突破,潜力无穷

  • 2022年,DeepMind团队通过游戏训练AI发现矩阵乘法算法问题​

  • 《达摩院2022十大科技趋势》将 AI for Science 列为重要趋势

    • 人工智能成为科学家的新生产工具,催生科研新范式

  • 2023年,DeepMind发布AI工具GNoME (Nature),成功预测220万种晶体结构

  • AI for Science:为科学带来了模型与数据双驱动的新的研究范式

    • AI + 数学、AI + 化学、AI + 医药、AI + 量子、AI + 物理、AI + 天文 ...

AlphaGo
围棋机器人

AlphaTensor
发现矩阵算法

AlphaFold
蛋白质结构预测

验证数学猜想

科学智能:AI for Science

人工智能技术与引力波数据处理

Text

Pioneering works utilizing CNN

  • The most common and direct approach, from Computer Vision (CV) to GW signal processing: pixel point \(\Rightarrow\) sampling point.

 

 









 

  • Convolutional neural networks (CNN) can achieve comparable performance to Matched Filtering and surpass them in terms of execution speed (with GPU support) under Gaussian stationary noise.

PRL, 2018, 120(14): 141103.

PRD, 2018, 97(4): 044039.

Text

AI for Science \(\rightarrow\) AI for GW Astronomy




 

 

 

 




 

  • Artificial Intelligence (AI) has great potential to revolutionize gravitational wave astronomy by improving data analysis, modeling, and detector development.
  • Representation and supervised learning crucially extract features from GW signals, autonomously identifying informative features and leveraging labeled data for accuracy.

Exported: Oct, 2023 (in preparation)

人工智能技术与引力波数据处理

H.W., et al. PRD (2020)

H.W., et al. MLST (2024)

Text

Matched-filtering Convolutional Neural Network (MFCNN)

Real-time GW searches for GW150914

Intelligent Noise Reduction in GW Detection​(WaveFormer)

Text

人工智能技术与引力波数据处理

人工智能技术与引力波数据处理

PRL 127, 24 (2021) 241103.

PRL 130, 17 (2023) 171403.

Real-time gravitational wave science with neural posterior estimation

PRD 108, 4 (2023): 044029.

Neural Posterior Estimation with Guaranteed Exact Coverage: The Ringdown of GW150914

arXiv:2310.13405, LIGO-P2300306

Cosmological Inference using Gravitational Waves and Normalising Flows

Normalizing Flows as an Avenue to Studying Overlapping Gravitational Wave Signals

Sampling with prior knowledge for high-dimensional gravitational wave data analysis

He Wang, et al. Big Data Min. Anal. (2021)

引力波数据分析
之知识框架

Knowledge Framework

  • 理论基础:
    • 引力波物理
    • 数字信号处理
    • 数理统计
  • 编程基础:
    •  
    •  
    •  
  • 硬件基础:
    •  


  •  

Dieter Rasch, Dieter Schott. Mathematical Statistics, (2018)

数理统计

引力波物理与引力波天文学

Miller, M.C., Yunes, N. The new frontier of gravitational waves. Nature 568, 469–476 (2019).

数字信号处理 (DSP)

R.C. Cofer, Benjamin F. Harding, in Rapid System Prototyping with FPGAs, 2006

引力波数据分析:知识框架

  • 理论基础:
    • 引力波物理 (pycbc, lalsuite, lisacode, bilby, ...)
    • 数字信号处理 (scipy, stat, ...)
    • 数理统计 (bilby, emcee, ptemcee, ptmcmc, …)
  • 编程基础:
    • Python (numpy, pandas; matplotlib; ...)
    • AI (scikit-learn, XGBoost, PyTorch, TensorFlow, JAX, ...)
    • Linux (docker, github, bash, vim, emacs …)
  • 硬件基础:

引力波数据分析:知识框架

引力波太极实验室:《引力波数据探索:编程与分析实战训练营》 2023.11 - 2024.1

  • 第 0 部分:通向自我实现之路
  • 第 1 部分:编程开发环境与工作流
    • 基础运维技术
    • 容器化技术
    • 实战项目:Python / Jupyter 开发环境搭建 + 远程连接 VS Code
    • 实战项目:LALsuite / LISAcode 的源码编译 (optional)
    • Git 分布式版本控制系统
  • 【公开课】数据技术演进与现实应用 (特邀嘉宾:田昕峣)
  • 第 2 部分:基于 Python 的数据分析基础
    • 数据科学语言 Python 从入门到熟悉
    • 数据分析实训之 Numpy / Pandas
    • 实战项目:GW Event Catalog 的探索性数据分析
    • 实战项目:股票数据分析案例 (optional)
    • 基于 Python 的数据可视化理论与实践之 Matplotlib / Seaborn
    • 实战项目:GWTC 论文中的 Figures
    • 实战项目:针对 GW150914 信号处理与匹配滤波数据分析
  • 【公开课】贝叶斯推断在引力波科学中的应用 (特邀嘉宾:赵俊杰)

引力波数据分析:知识框架

引力波太极实验室:《引力波数据探索:编程与分析实战训练营》 2023.11 - 2024.1

  • 第 3 部分:机器学习基础
    • 机器学习算法之应用起步
    • 机器学习算法之应用进阶
    • 实战项目:基于 LIGO 的 Glitch 元数据完成多分类任务
    • 实战项目:基于 LIGO 的 Glitch 时频图数据实现聚类分析
  • 第 4 部分:深度学习基础
    • 深度学习技术概述与神经网络基础
    • 实战项目:训练一个3层神经网络(手撸版)
    • 卷积神经网络与引力波信号探测
    • 实战项目:使用 CNN 识别双黑洞系统引力波信号
    • Kaggle数据科学竞赛 (黑客马拉松): Can you find the GW signals?
  • 【公开课】AI发展全景与GPT前沿解析 (特邀嘉宾:高民权)

引力波数据分析:知识框架

引力波数据分析?

程序猿?

数据分析师?

运维工程师?

引力波数据分析?

程序猿?

数据分析师?

运维工程师?

引力波数据分析

引力波物理科学家

数据科学家

人工智能
算法工程师

Thank You!

Questions?