Discover the Higgs with Deep Neural Networks

Sebastián Ordoñez y Juan Manuel Moreno

 

Universidad Nacional de Colombia

Diciembre 2 , 2023

First Colombian Network for HEP School 

Contenido

  • Introducción 
    • Motivación
  • Análisis de datos
    • Preparación de los datos: Pre-selección
    • Crear y entrenar la DNN
    • Evaluación y aplicación de la DNN
    • Figuras de mérito

Introducción

  • Los datos analizados en este proyecto fueron medidos con una energía del centro de masa de \(\sqrt{s}=13 \text{ TeV}\) con una luminosidad integrada de \(10 \text{ fb}^{-1}\) en el año 2016.

 

  • Golden channel: H \(\rightarrow ZZ \rightarrow llll\)

 

Las muestras usadas contienen únicamente cuatro leptones reconstruidos en el estado final.

  • Objetivo: Determinar si es posible descubrir el boson de Higgs en el canal H\(\rightarrow ZZ \rightarrow llll\) usando una DNN aplicada a datos del ATLAS open data.

 

Análisis de datos: Exploración y preparación

  • Para el entrenamiento de nuestra DNN tenemos inicialmente dos conjuntos de datos:

 

Datos tipo Higgs signal  Datos tipo background

ggH125_ZZ4lep
llll

VBFH125_ZZ4lep
Zee

WH125_ZZ4lep
Zmumu

 ZH125_ZZ4lep
ttbar_lep
\rightarrow \boxed{\text{weights}} \rightarrow

Datos

Análisis de datos: Exploración y preparación

  • Aplicaremos una pre-selección básica a nuestros datos teniendo en cuenta las restricciones que impone el estado final: 
    • ID: Solo consideramos muones \(\mu^{\pm}\) y electrones \(e^{\pm}\) en el estado final
    • Carga: Suma total de la carga igual a 0

 

Pre-selección

N. events signal  N. events background

ggH125_ZZ4lep: 8.7; 161451 (raw)
llll: 266.55; 523957 (raw)

VBFH125_ZZ4lep: 0.78; 186870 (raw)
Zee: 43.42; 243 (raw)

WH125_ZZ4lep: 0.22; 9772 (raw)
Zmumu: 52.33; 257 (raw)

 ZH125_ZZ4lep: 0.0; 11947 (raw)
ttbar_lep: 28.31; 334 (raw)
Total: 10, 370040 (raw) Total: 391, 524791 (raw)
  • Estadística de las muestras después de la pre-selección
  • Pureza inicial de la muestra
\boxed{\frac{S}{S+B} = 2.42\%}

Análisis de datos: Exploración y preparación

Variables input

Masa invariante de los 4 leptones: \(m_{llll}\)

Análisis de datos: Exploración y preparación

Variables input

Lepton \(p_{T}\)

Análisis de datos: Exploración y preparación

Variables input

Lepton \(p_{T}\)

Análisis de datos: Exploración y preparación

Variables input

Lepton \(\eta\)

Lepton \(\eta\)

Análisis de datos: Exploración y preparación

Variables input

Lepton \(\eta\)

Análisis de datos: Crear y entrenar la DNN

  • Es necesario dividir las muestras de entrenamiento en dos:
    • 60% de los datos (signal + background) son usados para entrenar.
    • 40% son usados para probar el rendimiento de nuestra red neuronal.

 

Partición de datos: Entrenamiento y prueba

Adicionalmente estas muestras divididas son reescaladas para obtener el mismo número de eventos esperados en cada una de ellas

Red Neuronal

Análisis de datos

  • Revisión de la variable de predicción en los datos de entrenamiento y de prueba

Incluyendo weights

Evaluación y aplicación de la DNN

Análisis de datos: Evaluación y aplicación de la DNN

Sin incluir weights

Análisis de datos

Figuras de merito: Significancia y pureza

Significancia

Pureza

\boxed{\frac{S}{S+N}}
\boxed{\frac{S}{\sqrt{S+N}}}

0.875

Corte óptimo

Análisis de datos

Aplicación del corte óptimo: MC

Masa invariante de los 4 leptones después del corte en las muestras de Monte Carlo

\text{before} \rightarrow \text{DNN} \rightarrow \text{after}

Análisis de datos

Aplicación del corte óptimo: Datos

Masa invariante de los 4 leptones después del corte en las muestras de datos

We discovered the Higgs! :-)

Gracias!