He Wang PRO
Knowledge increases by sharing but not by saving.
分享人:蒲帅
AstroInfer 团队成员:蒲帅(杭州电子科技大学)、王琰诗琪(桂林理工大学)、王赫(中国科学院大学)
本研究使用了两个主要数据源:
1.LAMOST 光谱巡天数据:从中国科学院国家天文台大科学装置郭守敬望远镜(LAMOST)官方网站获取。
2.AstroOne 理论模型数据:从项目主办方提供的链接下载,包含基于理论模型计算的上述五个参数预测值。
为确保两个数据集中的恒星对象一一对应,我们采用了三重匹配策略:
通过这种方式,我们成功构建了包含理论预测值和实测值的综合数据集,为后续分析提供了基础。每个参数均以"-la"(LAMOST实测值)和"-as"(AstroOne理论值)后缀区分。
在本分析中,我们对LAMOST和AstroOne两个天文数据集进行了清理和初步分析。以下是主要步骤和发现:
这些清理步骤为后续的深入分析和模型构建奠定了基础,确保我们使用的数据尽可能完整和可靠。
在本分析中,我们对LAMOST和AstroOne两个天文数据集进行了清理和初步分析。以下是主要步骤和发现:
这些清理步骤为后续的深入分析和模型构建奠定了基础,确保我们使用的数据尽可能完整和可靠。
在上一节中,我们已经完成了对各个变量的单变量分析,包括分布特性、缺失值处理和数据质量评估。这为我们理解数据集的基本特征提供了重要基础。现在,我们将进一步深入探索变量之间的关系和交互作用。
天文观测数据的质量评估对于后续分析至关重要。不同观测设备和方法可能导致系统性差异,因此我们需要:
对于每个关键天体物理参数(RV, TEFF, LOGG, FE_H, ALPHA_FE),我们将:
这种分析将帮助我们理解数据质量,识别潜在的系统性偏差,并为后续的多变量分析和模型构建提供依据。特别是,我们将关注ALPHA_FE参数,由于其在LAMOST数据中存在大量缺失,了解其在有效测量中的误差特性尤为重要。
下面进一步考察每个变量的误差情况。
从上图的径向速度(Radial Velocity)残差分析可以观察到以下几个关键特点:
这些观察结果对于理解两种测量方法的适用范围和限制非常重要,也为后续分析提供了方向。特别是,需要考虑开发更适合处理这种非高斯、非随机误差结构的统计模型。
从上图的有效温度(Effective Temperature)残差分析可以观察到以下几个关键特点:
这些观察结果对于理解恒星参数测量的系统性误差非常重要,也为改进光谱分析方法提供了方向。特别是,针对不同温度区间开发专门的校准方法可能会显著提高测量精度。
从上图的表面重力(Surface Gravity)残差分析可以观察到以下几个关键特点:
这些观察结果对于理解恒星表面重力测量的系统性误差非常重要,也为改进光谱分析方法提供了方向。特别是,针对低表面重力恒星开发专门的校准方法可能会显著提高测量精度。
从上图的金属丰度(Metallicity)残差分析可以观察到以下几个关键特点:
这些观察结果对于理解恒星金属丰度测量的系统性误差非常重要,也为改进光谱分析方法提供了方向。特别是,针对极端金属丰度恒星开发专门的校准方法可能会显著提高测量精度。
从上图的α元素丰度残差分析可以观察到以下几个关键特点:
这些观察结果对于理解恒星α元素丰度测量的系统性误差非常重要,也为改进光谱分析方法提供了方向。特别是,针对极端α元素丰度恒星开发专门的校准方法可能会显著提高测量精度。
天体物理参数之间通常存在复杂的相互关系,这些关系可以揭示恒星演化和宇宙化学演化的重要信息。在这一部分,我们将:
LAMOST与AstroOne关键物理参数相关性
从相关性矩阵图中,我们可以观察到LAMOST和AstroOne两个数据集之间的参数相关性差异:
1.LAMOST和AstroOne在某些参数对的相关性强度上存在差异,这可能反映了两种光谱分析方法的系统性差异。
2.径向速度(Radial Velocity)与其他参数的相关性在两个数据集中都较弱,表明恒星运动学特性与大气参数之间没有强关联。
这种相关性分析有助于理解恒星参数之间的物理关系,以及不同光谱分析方法可能引入的系统性差异。特别是对于金属丰度与α元素丰度之间的负相关性,这是恒星化学演化的重要指标,在两个数据集中都得到了验证。
1. 分布模式:LAMOST数据集的Alpha元素丰度分布呈现出更明显的双峰结构,对应于银河系盘和晕的恒星种群;而AstroOne数据集的分布相对更为连续
2. 区分度:LAMOST数据在降维空间中基于Alpha元素丰度的区分更为明显,这可能反映了LAMOST光谱分析方法对Alpha元素丰度测量的敏感性更高
3. 与金属丰度的相关性:在两个数据集中,Alpha元素丰度与金属丰度(FE_H)都表现出一定的相关性,但LAMOST数据中这种相关性更为明显,特别是在低金属丰度区域的高Alpha元素丰度恒星
这些差异对于研究银河系化学演化历史和恒星形成历史具有重要意义,特别是在区分不同恒星种群(如银河系盘、晕、球状星团等)时,Alpha元素丰度是一个关键的判断指标。
降维分析是天体物理数据分析中的一个重要工具,它可以帮助我们理解数据集的结构和模式。在这一部分,我们使用PCA(主成分分析)、t-SNE(t-分布随机邻域嵌入)和UMAP(统一流形近似与投影)来对比LAMOST和AstroOne数据集在降维空间中的特征分布差异。
PCA空间:
AstroOne的PCA结果中Alpha元素丰度分布更为均匀,从低值(紫色)到高值(绿色)的过渡更为连续
t-SNE空间:
Alpha元素丰度在AstroOne的t-SNE空间中形成了较为模糊的边界,聚类结构不如LAMOST数据明显
UMAP空间:
UMAP显示AstroOne的Alpha元素丰度分布形成了连续的流形结构,但区分度不如LAMOST数据清晰
PCA空间:
Alpha元素丰度在LAMOST的PCA空间中呈现出较为清晰的分层结构,高Alpha元素丰度(黄色)和低Alpha元素丰度(紫色)形成了不同的区域
t-SNE空间:
在t-SNE降维结果中,Alpha元素丰度形成了几个明显的聚类,特别是高Alpha元素丰度恒星形成了独立的聚类区域
UMAP空间:
UMAP结果显示Alpha元素丰度在LAMOST数据中形成了分支状结构,高Alpha元素丰度恒星群体与低Alpha元素丰度恒星群体明显分离
在本分析中,我们比较了LAMOST和AstroOne两个天文光谱巡天数据集的恒星参数。这两个数据集包含了相同天区的恒星,但使用了不同的光谱分析方法得到恒星的物理参数,如有效温度(TEFF)、表面重力(LOGG)、金属丰度(FE_H)、α元素丰度(ALPHA_FE)和径向速度(RV)。
这项分析对于理解不同光谱巡天数据集之间的系统差异至关重要,有助于:
致谢
感谢各位专家对本研究的指导与支持,特别感谢LAMOST团队和AstroOne项目组提供宝贵的数据资源。
By He Wang