引力波数据分析

—— 算法、人工智能、机器学习

王赫

王赫博士,现任中国科学院大学国际理论物理中心(亚太地区)E系列副研究员。2020年博士毕业于北京师范大学物理系,先后在中国科学院理论物理研究所、鹏城国家实验室(访问学者)和中国科学院大学从事博士后研究工作。目前作为 LIG0-Virgo-KAGRA 机器学习算法组co-chair,LISA core member 和国家天文科学数据中心青年数据科学家,作为核心成员重点参与中国空间引力波探测“太极计划”的科学数据分析工作,已在国内外学术期刊发表SCI论文40余篇。其研究涵盖引力波信号搜索、噪声建模、参数反演及其与多信使天文学的交叉应用

在OpenReview.net上对NeurIPS、ICML、ACL等多个AI顶会和AI4Science Workshop审稿,并受邀担任PLB, MLST等知名期刊的审稿人;《天文技术与仪器(英文)》(Astronomical Techniques and Instruments,ATI)青年编委;《Scientific Reports》编委。年均发表8-10篇SCI期刊,通讯>5篇。

Teaching

  • Jan 2024 |《引力波数据探索:编程与分析实战训练营》太极实验室线上培训
  • Aug 2023 | 引力波暑期学校《引力波数据处理与机器学习》:中山大学天琴中心
  • Jan 2022 - May 2022 |《数据可视化初了解》:知乎盐选
  • Apr 2021 – Jul 2021 | 人工智能从业者认证课程:腾讯云·课程开发
  • Dec 2020 – Jul 2021 |《深度学习之 PyTorch 实战》:万⻔大学
  • Jun 2020 – Nov 2020 |《Python 数据可视化与实战》:万⻔大学
  • Apr 2020 – Oct 2020 |《大数据预处理》国家开放大学 · 大数据挖掘与技术系列课程
  • Feb 2020 – Nov 2020 |《Python 程序设计》国家开放大学 · 大数据挖掘与技术系列课程
  • Aug 2019 |《Python 数据挖掘工具》中原银行 · 校招生培训系列课程

初次见面,

请多关照!

我是谁?

王赫,
LIGO-VTRGO-KAGRA 科学合作组成员。2020 年博士毕业于北京师范大学物理系,2020-2022 年于中科院理论物理研究所从事博士后研究,2021-2022 年赴鹏城实验室担任访问学者,2022 年至今为国科大国际理论物理中心(亚太地区)特别研究助理,2022 年获国家天文科学数据中心青年数据科学家称号。

目前主要从事引力波数据分析、引力检验以及数据处理技术(AI)相关的理论建模和算法开发工作。

我是做什么的?

Data quality improvement

Credit: Marco Cavaglià 

LIGO-Virgo data processing

GW searches

Astrophsical interpretation of GW sources

双星并合系统产生的引力波波源

引力波振幅的测量

  • 我是谁
  • 很 low 的码农?股票分析师?
  •  
  • 引力波天文学科学家
  • 数据科学家
  • 人工智能算法工程师
  • 就业前景
  • 引力波数据分析的挑战

引力波数据分析?

程序猿?

数据分析师?

运维工程师?

引力波数据分析!

引力波物理科学家

数据科学家

人工智能
算法工程师

引力波天文学

Gravitational-wave astronomy is a subfield of astronomy concerned with the detection and study of gravitational waves emitted by astrophysical sources.

引力波是什么?


  • 引力波是时空的涟漪。

  • 大物体的引力扭曲空间和时间,或称为“时空”,就像保龄球在弹跳床上滚动时改变其形状一样。较小的物体因此会以不同的方式移动——就像弹跳床上朝向保龄球大小的凹陷螺旋而去的弹珠,而不是坐在平坦的表面上。

引力波天文学

  • 爱因斯坦于1916年提出广义相对论,并预言了引力波的存在
  • 引力波是广义相对论中的一种强场效应
    • 2015年:首次实验探测到双黑洞并合引力波
    • 2017年:首次双中子星多信使探测,开启多信使天文学时代
    • 2017年:引力波探测成果被授予诺贝尔物理学奖
    • 至今:发现了超过 90 个引力波事件
  • 2024年:中国科学院大学加入地面引力波实验LIGO-Virgo-KAGRA (LVK)
    科学合作组织,成为LVK目前在中国大陆地区的第二家成员单位​。
  • 未来规划:
    • 2024-2025年:有希望探测到更多不同类型的引力波事件
    • 空间引力波探测计划 (LISA/Taiji/Tianqin) + XG (CE/ET)

LIGO-VIRGO-KAGRA network

Gravitational waves generated by binary black holes system

GW detector

引力波天文学

  • 引力波探测打开了探索宇宙的新窗口

  • 不同波源,频率跨越 20 个数量级,不同探测器

  • 多信使天文学

引力波天文学

  • 基础理论的检验与修正
    • 基础物理学
      • 引力子是否有质量, 引力波的传播速度 ...
    • 天体物理学
      • 大质量恒星演化模型, 恒星级双黑洞的形成机制 ...
    • 宇宙学
      • 哈勃常数的测量, 暗能量 ...

​​​

  • The current clouds over fundamental physics:
    • 量子力学与广义相对论的统一
    • 星系旋转曲线(暗物质)、宇宙加速膨胀(暗能量)
    • 哈勃常数H0
    • 中微子震荡和质量问题
    • ...

引力波天文学与数据处理

  • 伯纳德·舒尔茨曾列出成功观测引力波的五条关键要素:
    1. 良好的探测器技术
    2. 良好的波形模板
    3. 良好的数据分析方法和技术
    4. 多个独立探测器间的一致性观测
    5. 引力波天文学和电磁波天文学的一致性观测

​​DOI:10.1063/1.1629411

©Floor Broekgaarden (repo)

The first GW event of GW150914

引力波天文学与数据处理

引力波观测数据

  • ​噪声: 非高斯 + 非稳态

 

 

 

 

 

 

  • (地面引力波探测) 信噪比极低,通常约为噪声幅度的1/100(-60分贝)

  • (空间引力波探测) 在任务观测期间接收到的所有引力波信号的叠加(例如:\(10^4\)  个双星黑洞系统,\(10\sim10^2\) 个超大质量黑洞,以及\(10\sim10^3\) 个极端质量比旋近系统等)。

LISA / Taiji project

匹配滤波方法

  • 高斯稳态噪声环境下,提取信号的最优算法

  • 假设:引力波观测数据 =
    高斯稳态噪声 + 某引力波信号

            \(d(t) = n(t) + h(t)\)

LIGO-VIRGO-KAGRA

什么是一个好的科学理论?

“科学理论”是核心特征?

  • Consistency(一致性)
    • 一个科学理论应该在逻辑上内部一致,并与已有的科学知识相协调,不能自相矛盾,也不应与已被广泛验证的理论冲突。一致性也是科学理论“质量好坏”的基本评判指标之一。

  • Falsifiability(可证伪性)
    • 卡尔·波普尔提出:科学理论必须可被实验证伪——即存在可观测的结果可能使它被证明为假。
      一个不能被实验证伪的理论从逻辑上讲不能算作科学理论。
  • Predictive Power(预测性)
    • 强有力的科学理论应该能够预测尚未观察到的现象或事件,并且这些预测能够被实验或观察验证。
  • Wikipedia contributors. (2025). Scientific theory. In Wikipedia.  
  • ScienceTimes. (2025). From hypothesis to breakthrough: What makes a theory scientific.  
  • Edg.it (2025). What is a good scientific theory?  
  • Wikipedia contributors. (2025). Falsifiability. In Wikipedia.  
  • 一个理论的价值,不只在于它是否优美,更在于它能否经受逻辑、观测与实验的检验。

常见的误解:

科学理论是初步的想法,当积累到足够的数据和证据时,它最终将转变为科学定律。

(理论并不会因为积累了更新或更好的证据而转变为科学定律。)

某实验或观测证明了某科学理论。

(理论只能被证伪,无法被证明,顶多只能说该证据支持了某理论。)

  • 理论提出可检验的预测,实验产生观测数据,而算法负责判断:数据究竟是否支持理论。

真理的仲裁:从物理假说到算法验证

Everything begins with physics. 
Everything ends with algorithms.
  • 理论家在自然的试卷上挥毫,实验家捕捉宇宙的笔触,而我们是那群在噪声中寻找真相的"阅卷人"。

Credit: here

引力波数据处理
与人工智能

Gravitational Wave Data Analysis and Artificial Intelligence

引力波数据处理与人工智能技术

H.W., et al. MLST (2024)

引力波数据处理与人工智能技术

引力波数据处理与人工智能技术

preliminary

引力波数据处理与人工智能技术

arXiv:2508.03661[cs.AI]

科学智能:AI for Science

preliminary

科学智能:AI for Science

A800 x 3, A6000

  • 2016年,AlphaGo 第一版发表在了 Nature 杂志上
  • 2021年,AIphaFold 预测蛋白质结构登上 Science、Nature 年度技术突破
  • 2022年,DeepMind团队通过游戏训练AI发现矩阵乘法算法问题​
  • 《达摩院2022十大科技趋势》将 AI for Science 列为重要趋势
    • “人工智能成为科学家的新生产工具,催生科研新范式”
  • 2023年,DeepMind发布AI工具GNoME (Nature),成功预测220万种晶体结构
  • 2023年3月,为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,布局“人工智能驱动的科学研究”前沿科技研发体系​。
  • 2024.4:美国总统科学技术顾问委员会(PCAST)发布《赋能研究:利用人工智能应对全球挑战》报告
  • 2024.5: 《Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research》 (Royal Soc.)

AlphaGo
围棋机器人

AlphaTensor
发现矩阵算法

AlphaFold
蛋白质结构预测

验证数学猜想

科学智能:AI for Science

人工智能技术与引力波数据处理

Text

Pioneering works utilizing CNN

  • The most common and direct approach, from Computer Vision (CV) to GW signal processing: pixel point \(\Rightarrow\) sampling point.

 

 









 

  • Convolutional neural networks (CNN) can achieve comparable performance to Matched Filtering and surpass them in terms of execution speed (with GPU support) under Gaussian stationary noise.

PRL, 2018, 120(14): 141103.

PRD, 2018, 97(4): 044039.

Text

AI for Science \(\rightarrow\) AI for GW Astronomy




 

 

 

 




 

  • Artificial Intelligence (AI) has great potential to revolutionize gravitational wave astronomy by improving data analysis, modeling, and detector development.
  • Representation and supervised learning crucially extract features from GW signals, autonomously identifying informative features and leveraging labeled data for accuracy.

Exported: Oct, 2023 (in preparation)

人工智能技术与引力波数据处理

H.W., et al. PRD (2020)

H.W., et al. MLST (2024)

Text

Matched-filtering Convolutional Neural Network (MFCNN)

Real-time GW searches for GW150914

Intelligent Noise Reduction in GW Detection​(WaveFormer)

Text

Yu-Xin Wang, Xiaotong Wei, Chun-Yue Li, Tian-Yang Sun, Shang-Jie Jin, He Wang*, Jing-Lei Cui, Jing-Fei Zhang, and Xin Zhang*. arXiv:2410.20129. PRD, accepted (2025)

Text

Exploring Beyond General Relativity

人工智能技术与引力波数据处理

人工智能技术与引力波数据处理

PRL 127, 24 (2021) 241103.

PRL 130, 17 (2023) 171403.

Real-time gravitational wave science with neural posterior estimation

PRD 108, 4 (2023): 044029.

Neural Posterior Estimation with Guaranteed Exact Coverage: The Ringdown of GW150914

arXiv:2310.13405, LIGO-P2300306

Cosmological Inference using Gravitational Waves and Normalising Flows

Normalizing Flows as an Avenue to Studying Overlapping Gravitational Wave Signals

Sampling with prior knowledge for high-dimensional gravitational wave data analysis

He Wang, et al. Big Data Min. Anal. (2021)

人工智能技术与引力波数据处理

基于大语言模型的科学发现

计算机视觉应用与引力波数据处理

Gebru et al. ICCV (2017)

Zhou et al. CVPR (2018)

Shen et al. CVPR (2018)

Image courtesy of Tesla (2020)

从AI应用的原理理解技术相同点

eg: GW search

科学智能:AI for Science

The core driving force of AI4Sci largely lies in its “interpolation” generalization capabilities, showcasing its powerful complex modeling abilities.

From 李宏毅

科学智能:AI for Science

Test of General Relatively

2403.18936

hewang@ucas.ac.cn

2407.07229

2103.01641

The core driving force of AI4Sci largely lies in its “interpolation” generalization capabilities, showcasing its powerful complex modeling abilities.

From 李宏毅

引力波数据分析
之知识框架

Knowledge Framework

  • 理论基础:
    • 引力波物理
    • 数字信号处理
    • 数理统计
  • 编程基础:
    •  
    •  
    •  
  • 硬件基础:
    •  


  •  

Dieter Rasch, Dieter Schott. Mathematical Statistics, (2018)

数理统计

引力波物理与引力波天文学

Miller, M.C., Yunes, N. The new frontier of gravitational waves. Nature 568, 469–476 (2019).

数字信号处理 (DSP)

R.C. Cofer, Benjamin F. Harding, in Rapid System Prototyping with FPGAs, 2006

引力波数据分析:知识框架

  • 理论基础:
    • 引力波物理 (pycbc, lalsuite, lisacode, bilby, ...)
    • 数字信号处理 (scipy, stat, ...)
    • 数理统计 (bilby, emcee, ptemcee, ptmcmc, …)
  • 编程基础:
    • Python (numpy, pandas; matplotlib; ...)
    • AI (scikit-learn, XGBoost, PyTorch, TensorFlow, JAX, ...)
    • Linux (docker, github, bash, vim, emacs …)
  • 硬件基础:

引力波数据分析:知识框架

《引力波探测中关于深度学习数据分析的研究》(2020.6)

引力波数据分析:知识框架

    第五章 卷积神经网络结构对引力波信号识别的性能研究
        5.1 引言
        5.2 引力波数据的制备和处理流程
        5.3 引力波数据分析中信噪比的比较分析
        5.4 卷积神经网络的超参数调优和性能比较
        5.5 总结与结论
    第六章 匹配滤波-卷积神经网络(MF-CNN)模型的应用研究
        6.1 引言
        6.2 时域中的匹配滤波
        6.3 用于匹配滤波的卷积神经单元
        6.4 匹配滤波-卷积神经网络(MF-CNN)模型的构造
        6.5 搜寻疑似引力波信号的策略
        6.6 数据准备与模型微调
        6.7 真实 LIGO 引力波数据上的搜寻结果
        6.8 总结与结论
    第七章 总结与展望
    附录
        A. 采样定理与 Nyquist 频率
        B. 关于功率谱密度性质的数学证明
        C. 最大似然估计和交叉熵

    第一章 绪论
        1.1 引言
        1.2 多信使天文学
        1.3 研究现状、机遇与挑战
        1.4 本文研究的目标与框架
    第二章 引力波探测和数据分析理论
        2.1 引言
        2.2 引力波探测技术
        2.3 信号处理与数据分析方法
        2.4 匹配滤波技术
    第三章 深度学习的理论基础
        3.1 引言
        3.2 机器学习理论
        3.3 深度神经网络
        3.4 卷积神经网络
    第四章 引力波探测中关于神经网络
的可解释性研究
        4.1 引言
        4.2 神经网络的结构
        4.3 数据集的制备和优化策略
        4.4 引力波信号识别的泛化能力
        4.5 引力波信号特征的可视化表示
        4.6 引力波波形特征的灵敏度分析

 

引力波太极实验室:《引力波数据探索:编程与分析实战训练营》 2023.11 - 2024.1

  • 第 0 部分:通向自我实现之路
  • 第 1 部分:编程开发环境与工作流
    • 基础运维技术
    • 容器化技术
    • 实战项目:Python / Jupyter 开发环境搭建 + 远程连接 VS Code
    • 实战项目:LALsuite / LISAcode 的源码编译 (optional)
    • Git 分布式版本控制系统
  • 【公开课】数据技术演进与现实应用 (特邀嘉宾:田昕峣)
  • 第 2 部分:基于 Python 的数据分析基础
    • 数据科学语言 Python 从入门到熟悉
    • 数据分析实训之 Numpy / Pandas
    • 实战项目:GW Event Catalog 的探索性数据分析
    • 实战项目:股票数据分析案例 (optional)
    • 基于 Python 的数据可视化理论与实践之 Matplotlib / Seaborn
    • 实战项目:GWTC 论文中的 Figures
    • 实战项目:针对 GW150914 信号处理与匹配滤波数据分析
  • 【公开课】贝叶斯推断在引力波科学中的应用 (特邀嘉宾:赵俊杰)

引力波数据分析:知识框架

引力波太极实验室:《引力波数据探索:编程与分析实战训练营》 2023.11 - 2024.1

  • 第 3 部分:机器学习基础
    • 机器学习算法之应用起步
    • 机器学习算法之应用进阶
    • 实战项目:基于 LIGO 的 Glitch 元数据完成多分类任务
    • 实战项目:基于 LIGO 的 Glitch 时频图数据实现聚类分析
  • 第 4 部分:深度学习基础
    • 深度学习技术概述与神经网络基础
    • 实战项目:训练一个3层神经网络(手撸版)
    • 卷积神经网络与引力波信号探测
    • 实战项目:使用 CNN 识别双黑洞系统引力波信号
    • Kaggle数据科学竞赛 (黑客马拉松): Can you find the GW signals?
  • 【公开课】AI发展全景与GPT前沿解析 (特邀嘉宾:高民权)

引力波数据分析:知识框架

引力波数据分析?

程序猿?

数据分析师?

运维工程师?

引力波数据分析?

数据分析师?

程序猿?

运维工程师?

引力波数据分析

引力波物理科学家

数据科学家

人工智能
算法工程师

Thank You!

Questions?

Everything begins with physics. Everything ends with algorithms.

Complementary orbital configurations of Taiji, TianQin, and LISA

Adapted from Ruan et al., Nature Astronomy (2020).

空基引力波探测

地基引力波探测

月基引力波探测

Conceptual illustration of the Lunar GW instrument (generated by ChatGPT)

LIGO-VIRGO-KAGRA network

引力波数据分析

交叉应用(理论与数值方法)

人工智能技术

  • 信号探测/匹配滤波
  • 统计推断/参数估计
  • 引力检验/科学发现
  • 判别模型
  • 生成模型
  • 大模型
  • AI 智能体
  • 数值相对论
  • 符号回归/精确解
  • 数值求解
  • 多模态量化数据分析
  • 科学数据平台
  • 自动化算法发现

技术版图

研究主线是以引力波为核心场景,发展面向复杂物理数据的智能建模、统计推断与自动化科学发现方法。

课题组活动与协作机制

线上交流 · 线下协作

  • 定期汇报,及时反馈
  • 集中实操,共同推进
  • 开放讨论,促进合作

不只汇报结果,更重视一起动手解决问题。