Discover the Higgs with Deep Neural Networks
Sebastián Ordoñez y Juan Manuel Moreno
Universidad Nacional de Colombia
Diciembre 2 , 2023


First Colombian Network for HEP School

Contenido
- Introducción
- Motivación
- Análisis de datos
- Preparación de los datos: Pre-selección
- Crear y entrenar la DNN
- Evaluación y aplicación de la DNN
- Figuras de mérito
Introducción


- Los datos analizados en este proyecto fueron medidos con una energía del centro de masa de \(\sqrt{s}=13 \text{ TeV}\) con una luminosidad integrada de \(10 \text{ fb}^{-1}\) en el año 2016.
- Golden channel: H \(\rightarrow ZZ \rightarrow llll\)
Las muestras usadas contienen únicamente cuatro leptones reconstruidos en el estado final.
- Objetivo: Determinar si es posible descubrir el boson de Higgs en el canal H\(\rightarrow ZZ \rightarrow llll\) usando una DNN aplicada a datos del ATLAS open data.
Análisis de datos: Exploración y preparación
- Para el entrenamiento de nuestra DNN tenemos inicialmente dos conjuntos de datos:
Datos tipo Higgs signal | Datos tipo background |
---|---|
ggH125_ZZ4lep |
llll |
VBFH125_ZZ4lep |
Zee |
WH125_ZZ4lep |
Zmumu |
ZH125_ZZ4lep |
ttbar_lep |


\rightarrow \boxed{\text{weights}} \rightarrow
Datos
Análisis de datos: Exploración y preparación
- Aplicaremos una pre-selección básica a nuestros datos teniendo en cuenta las restricciones que impone el estado final:
- ID: Solo consideramos muones \(\mu^{\pm}\) y electrones \(e^{\pm}\) en el estado final
- Carga: Suma total de la carga igual a 0
Pre-selección
N. events signal | N. events background |
---|---|
ggH125_ZZ4lep: 8.7; 161451 (raw) |
llll: 266.55; 523957 (raw) |
VBFH125_ZZ4lep: 0.78; 186870 (raw) |
Zee: 43.42; 243 (raw) |
WH125_ZZ4lep: 0.22; 9772 (raw) |
Zmumu: 52.33; 257 (raw) |
ZH125_ZZ4lep: 0.0; 11947 (raw) |
ttbar_lep: 28.31; 334 (raw) |
Total: 10, 370040 (raw) | Total: 391, 524791 (raw) |
- Estadística de las muestras después de la pre-selección
- Pureza inicial de la muestra
\boxed{\frac{S}{S+B} = 2.42\%}
Análisis de datos: Exploración y preparación
Variables input
Masa invariante de los 4 leptones: \(m_{llll}\)


Análisis de datos: Exploración y preparación
Variables input


Lepton \(p_{T}\)
Análisis de datos: Exploración y preparación
Variables input


Lepton \(p_{T}\)
Análisis de datos: Exploración y preparación
Variables input
Lepton \(\eta\)


Lepton \(\eta\)
Análisis de datos: Exploración y preparación
Variables input
Lepton \(\eta\)


Análisis de datos: Crear y entrenar la DNN
- Es necesario dividir las muestras de entrenamiento en dos:
- 60% de los datos (signal + background) son usados para entrenar.
- 40% son usados para probar el rendimiento de nuestra red neuronal.
Partición de datos: Entrenamiento y prueba
Adicionalmente estas muestras divididas son reescaladas para obtener el mismo número de eventos esperados en cada una de ellas
Red Neuronal


Análisis de datos

- Revisión de la variable de predicción en los datos de entrenamiento y de prueba
Incluyendo weights

Evaluación y aplicación de la DNN
Análisis de datos: Evaluación y aplicación de la DNN

Sin incluir weights

Análisis de datos
Figuras de merito: Significancia y pureza


Significancia
Pureza
\boxed{\frac{S}{S+N}}
\boxed{\frac{S}{\sqrt{S+N}}}
0.875
Corte óptimo
Análisis de datos
Aplicación del corte óptimo: MC
Masa invariante de los 4 leptones después del corte en las muestras de Monte Carlo


\text{before} \rightarrow \text{DNN} \rightarrow \text{after}
Análisis de datos
Aplicación del corte óptimo: Datos
Masa invariante de los 4 leptones después del corte en las muestras de datos

We discovered the Higgs! :-)
Gracias!
CoNHEP 1-Project
By Sebastian Ordoñez
CoNHEP 1-Project
- 262