Gravitational-Wave Observatory Open Source Data Portal

基于引力波探测开源数据的共享数据门户

国家天文科学数据中心 · 青年数据科学家项目交流会议

2023年4月13日 09:10-09:25 | 腾讯会议ID: 427-440-498

王赫

hewang@ucas.ac.cn

中国科学院大学 · 国际理论物理中心(亚太地区)

  • 数据驱动的引力波天文学
  • 引力波数据的现状、需求与挑战
  • 共享数据门户的研究目标与研究方案
  • 已有的研究基础与条件
  • 预期研究成果与潜在价值

目录

引力波天文学

  • 引力波是广义相对论中的一种强场效应

    • 2015年:首次实验探测到双黑洞并合引力波

    • 2017年:首次双中子星多信使探测,开启多信使天文学时代

    • 2017年:引力波探测成果被授予诺贝尔物理学奖

    • 至今:发现了超过 90 个引力波事件

  • 未来:

    • 2023-2024年:有希望探测更多不同类型的引力波事件

    • 空间引力波探测计划 (LISA/Taiji/Tianqin) + XG (CE/ET)

地面引力波探测器网络

  • 伯纳德·舒尔茨曾列出成功观测引力波的五条关键要素:
    1. 良好的探测器技术
    2. 良好的波形模板
    3. 良好的数据分析方法和技术
    4. 多个独立探测器间的一致性观测
    5. 引力波天文学和电磁波天文学的一致性观测

​​DOI:10.1063/1.1629411

2017 年诺贝尔物理学奖

引力波天文学

  • 伯纳德·舒尔茨曾列出成功观测引力波的五条关键要素:
    1. 良好的探测器技术
    2. 良好的波形模板
    3. 良好的数据分析方法和技术
    4. 多个独立探测器间的一致性观测
    5. 引力波天文学和电磁波天文学的一致性观测

​​DOI:10.1063/1.1629411

首次探测双黑洞并合引力波事件 GW150914

  • 引力波是广义相对论中的一种强场效应

    • 2015年:首次实验探测到双黑洞并合引力波

    • 2017年:首次双中子星多信使探测,开启多信使天文学时代

    • 2017年:引力波探测成果被授予诺贝尔物理学奖

    • 至今:发现了超过 90 个引力波事件

  • 未来:

    • 2023-2024年:有希望探测更多不同类型的引力波事件

    • 空间引力波探测计划 (LISA/Taiji/Tianqin) + XG (CE/ET)

引力波天文学与机器学习

  • 基于机器学习技术的引力波数据分析方向成为新的研究热点

  • 通过机器学习算法对大规模引力波数据进行分析和处理,可以更加准确地识别引力波信号以及实现引力波波源参数反演
  • 机器学习技术还可以帮助引力波研究人员深入研究宇宙中的各种现象和物理规律,推动引力波天文学的发展

引力波天文学与机器学习

  • 引力波智能降噪与数据分析:

    • 引力波观测数据降噪模型+引力波暂现源事件信号搜寻

He Wang, et al. Intelligent noise suppression for gravitational wave observational data,
26 February 2023, PREPRINT (Version 1) available at Research Square.

DOI: 10.21203/rs.3.rs-2452860/v1

引力波数据的现状、需求与挑战

  • 能够快速地获取高质量、高精度且可靠的引力波科学数据都是至关重要的

  • 我国引力波数据分析基础薄弱,基础实施还不完善

  • 本项目基于引力波开放科学数据平台 (Gravitational-Wave Open Science Center, GWOSC) 发布的引力波真实观测数据和大量的科学分析结果

  • 数据量庞大:>17.2TB

  • 技术门槛较高:CernVM-FS (1-5MB/s, 42-209 days)

引力波数据的现状、需求与挑战

  • 能够快速地获取高质量、高精度且可靠的引力波科学数据都是至关重要的

  • 我国引力波数据分析基础薄弱,基础实施还不完善

  • 本项目基于引力波开放科学数据平台 (Gravitational-Wave Open Science Center, GWOSC) 发布的引力波真实观测数据和大量的科学分析结果

  • 数据量庞大:>17.2TB

  • 技术门槛较高:CernVM-FS (1-5MB/s, 42-209 days)

  • 存储数据的平台非常多且散乱 (GitHub / GitLab / Zenodo / LIGO DCC / ...)

  • 数据格式缺乏统一的标准和规范,普遍缺乏说明性引导和可视化预览

共享数据门户的研究目标与研究方案

  • 以LIGO科学合作组织公开发布的引力波探测数据集引力波科学分析结果为基础,搭建引力波开放数据库数据源,对数据的一致性进行统一规范化整理。

  • 以国家天文科学数据中心在线服务平台或其他云服务平台为基础,开发适用于引力波天文学研究的引力波探测开源数据门户

  • CKAN (开源数据管理系统): an open-source DMS (data management system) for powering data hubs and data portals.

  • Streamlit: 一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。

共享数据门户的研究目标与研究方案

  • VisibleGWStrain: 可调取并可视化O1-O3任意一段时域数据的进行观察和提取,展示数据质量等相关信息。
  • VisibleGWaveform: 可生成并可视化不同理论波形模板描述下的引力波波形信息(时域、频域和时频域)。
  • VisibleGWevents: 可查询并可视化各类引力波暂现源星表(GWTC,OGC等)和对应波源参数反演的分析结果。
  • 以LIGO科学合作组织公开发布的引力波探测数据集引力波科学分析结果为基础,搭建引力波开放数据库数据源,对数据的一致性进行统一规范化整理。

  • 以国家天文科学数据中心在线服务平台或其他云服务平台为基础,开发适用于引力波天文学研究的引力波探测开源数据门户

已有的研究基础与条件

  • 技术储备:

    • 曾设计并开发了DataSciComp门户网站

    • NoSQL非关系型的数据库

    • 前端Flask架构和Docker容器化技术

    • 后端架构是基于微服务 (Microservice Architecture) 技术

DataSciComp

  • 数据准备:

    • 已经采集完近 17.2TB 引力波探测数据,并收集了较为完整的各学术权威机构所发布的引力波科学数据结果

预期研究成果与潜在价值

  • 预期研究成果

    1. 引力波探测数据治理手册

    2. 引力波探测开源数据门户

      • 开放数据获取 API 接口

      • 可交互式数据可视化应用

        • 引力波观测数据 (VisibleGWStrain)

        • 引力波模板波形 (VisibleGWaveform)

        • 引力波科学分析结果 (VisibleGWevents)

    3. 部分核心代码将会在开源平台Zenodo上以数字出版物的形式发布,并撰写软著

  • 潜在价值

    • 为我国引力波天文学数据处理领域的科研人员带来便利

    • 作为中国科学院”空间太极计划“科学数据平台的技术储备

    • 教学辅助和学术参考价值

    • 科普教育意义

Wilkinson, M., et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016).

DOI: 10.1038/sdata.2016.18

谢谢您的聆听!

预期研究成果与潜在价值

  • 预期研究成果

    1. 引力波探测数据治理手册

    2. 引力波探测开源数据门户

      • 开放数据获取 API 接口

      • 可交互式数据可视化应用

        • 引力波观测数据 (VisibleGWStrain)

        • 引力波模板波形 (VisibleGWaveform)

        • 引力波科学分析结果 (VisibleGWevents)

    3. 部分核心代码将会在开源平台Zenodo上以数字出版物的形式发布,并撰写软著

  • 潜在价值

    • 为我国引力波天文学数据处理领域的科研人员带来便利

    • 作为中国科学院”空间太极计划“科学数据平台的技术储备

    • 教学辅助和学术参考价值

    • 科普教育意义

预期研究成果与潜在价值

  • 预期研究成果

    1. 引力波探测数据治理手册

    2. 引力波探测开源数据门户

      • 开放数据获取 API 接口

      • 可交互式数据可视化应用

        • 引力波观测数据 (VisibleGWStrain)

        • 引力波模板波形 (VisibleGWaveform)

        • 引力波科学分析结果 (VisibleGWevents)

    3. 部分核心代码将会在开源平台Zenodo上以数字出版物的形式发布,并撰写软著

  • 潜在价值

    • 为我国引力波天文学数据处理领域的科研人员带来便利

    • 作为中国科学院”空间太极计划“科学数据平台的技术储备

    • 教学辅助和学术参考价值

    • 科普教育意义