Abstract:
RESUMEN: Esta tesis se centra en el problema de la clasificación de eventos en física de altas energías. La metodología implementada es la conocida como End-to-End, la cual se
basada en redes neuronales artificiales aplicadas a imágenes que son reconstruidas a
partir de las señales electrónicas del detector. Su principal ventaja es que el clasificador
tiene acceso a la mayor cantidad de información recolectada por el detector. Se utilizan
datos abiertos del experimento CMS del LHC.
Los eventos en los cuales se enfoca este trabajo son los DiJet y MultiJet, los cuales
son caracterizados por las propiedades cinemáticas de los jets en el evento. Previo a la
clasificación de los eventos, se propone una segmentación de los jets. El segmentador
utilizado se basa en la red ResNet-101 y la clasificación de eventos es hecha por la
red ResJet, la cual es una modificación de las Redes Residuales que trabaja con las
características de los eventos y los jets contenidos en estos.
Para evaluar el funcionamiento del clasificador (ResJet), se compara su desempeño
con la red utilizada en el estado del arte de la metodología End-to-End, la
red ResNet-34. La comparación es hecha utilizando imágenes segmentadas y nosegmentadas.
Los resultados obtenidos reflejan una mejora al clasificar eventos nosegemtados
con la ResJet, en comparación con la ResNet-34. La mejora corresponde
a un incremento de 0.022 y de 0.023 puntos para el precision y recall, respectivamente.
Por otra parte, el uso de datos segmentados implicó una mejoría de 0.05 y 0.04
puntos en precision y recall (respectivamente), al utilizar la red ResNet-34.
ABSTRACT: This thesis focuses the problem of event classification in high energy physics. The implemented methodology is known as End-to-End, which is based on artificial neural
networks applied to images that are reconstructed from the electronic signals of the
detector. Its main advantage is that the classifier has access to the largest amount of
information collected by the detector. Open data from the CMS experiment is used.
The events on which this work focuses are the DiJet and MultiJet, which are
characterized by the kinematic properties of the jets in the event. Prior to the classification
of the events, a segmentation of the jets is proposed. The segmenter used
is based on the ResNet-101 network and the classification of events is done by the
ResJet network, which is a modification of the Residual Networks that works with
the characteristics of the events and the jets contained in these.
To evaluate the performance of the classifier (ResJet), its performance is compared
with the network used in the state-of-the-art of the End-to-End methodology, the
ResNet-34 network. The comparison is made using segmented and non-segmented
images. The results obtained reflect an improvement when classifying non-segmented
events with the ResJet, compared to the ResNet-34. The improvement corresponds
to an increase of 0.022 and 0.023 points for accuracy and recall, respectively. On the
other hand, the use of segmented data implied an improvement of 0.05 and 0.04 points
in accuracy and recall (respectively), when using the ResNet-34 network.
Description:
Tesis (Maestría en Ciencias de la Computación), Instituto Politécnico Nacional, CIC, 2022, 1 archivo PDF, (71 páginas). tesis.ipn.mx