DSpace Repository

Tratamiento de la complejidad de patrones de datos en cúmulos de información, con memorias asociativas

Show simple item record

dc.contributor.author Cleofas Sánchez, Laura
dc.date.accessioned 2017-05-10T07:07:44Z
dc.date.available 2017-05-10T07:07:44Z
dc.date.created 2013-12
dc.date.issued 2017-04-26
dc.identifier.citation Cleofas Sánchez, Laura. Tratamiento de la complejidad de patrones de datos en cúmulos de información, con memorias asociativas. Tesis (Doctorado en Ciencias de la Computación). Ciudad de México, Instituto Politécnico Nacional, Sección de Estudios de Posgrado e Investigación, Centro de Investigación en Computación. 2013. 110 p. es
dc.identifier.uri http://tesis.ipn.mx/handle/123456789/21573
dc.description.abstract En aplicaciones de reconocimiento de patrones (reconocimiento de voz, reconocimiento de letras, reconocimiento de rostros, entre otros), los estudios realizados durante la última década han mostrado que la regla de aprendizaje usada por los clasificadores y los problemas inherentes presentados en los conjuntos de datos (CD), tales como el desbalance de clases, outliers, bancos de datos muy grandes, entre otros. Influyen de manera significativa en el reconocimiento correcto de los patrones [Hua, 06], [Jap, 02]. En ese sentido, aunque los modelos asociativos se han utilizado ampliamente en el contexto de la recuperación de los patrones, en el presente trabajo se han usado para la tarea de clasificación. Es por esto, el interés de la presente investigación para proponer una nueva metodología que tome en cuenta tanto la tarea de clasificación como los problemas inherentes en los CD. Los resultados experimentales llevados a cabo mostraron los siguientes aspectos de interés:  En el primer escenario de estudio, el modelo CHAT reconoce más la clase minoritaria cuando se presenta el problema del desbalance. Sin embargo, está situación no se muestra con el resto de los clasificadores.  En el segundo escenario de estudio se observó que el modelo CHAT tiende a incrementar su rendimiento cuando las complejidades en los CD son tratadas con los métodos de bajo muestreo: Wilson y Selectivo.  En el tercer escenario de estudio se observó que el modelo CHAT reconoce más la clase minoritaria cuando se presenta un equilibrio entre la presión de las tasas, estas situaciones se presentan cuando no se realiza un previo muestreo y cuando se hace uso del método de Wilson. Además, se muestra un buen desempeño del modelo CHAT en términos de la AUC y MG, cuando se realiza un bajo muestreo con Wilson. No obstante, al considerar el método SMOTE, se observó que el desbalance entre las clases disminuyó considerablemente, de tal manera que el rendimiento de los modelos RB y RFBR incrementó.  En el cuarto escenario de estudio, el modelo Alfa Beta muestra un rendimiento pobre, sin embargo al aplicar los métodos de muestreo (bajo muestreo y sobre muestreo), se incrementa su rendimiento.  En el quinto escenario al realizar una significancia estadística entre los clasificadores, se mostró que el rendimiento del PM es significativamente mejor que los obtenidos por el C4.5 y MSV cuando el entrenamiento es realizado por Wilson. No obstante, al aplicar SMOTE se obtiene un equilibrio entre el rendimiento de las tasas. Asimismo, se observa que el rendimiento de la MSV en términos de la AUC y MG, es significativamente mejor que el rendimiento de la RB. es
dc.description.sponsorship CONACYT es
dc.language.iso es_MX es
dc.publisher Cleofas Sánchez, Laura es
dc.title Tratamiento de la complejidad de patrones de datos en cúmulos de información, con memorias asociativas es
dc.type Tesis es
dc.contributor.advisor Valdovinos Rosas, Rosa María
dc.contributor.advisor Camacho Nieto, Oscar


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account