Please use this identifier to cite or link to this item: http://tesis.ipn.mx/handle/123456789/30316
Title: Globalización y desigualdad, enfoque multidimensional con re-muestreo dirigido a redes neuronales artificiales y árboles clasificadores
Authors: Parada Rojas, Ana Cecilia
Ríos Bolivar, Humberto
Keywords: Globalización
Desigualdad
Redes neuronales
Issue Date: 26-Apr-2022
Citation: Parada Rojas, Ana Cecilia. (2019). Globalización y desigualdad, enfoque multidimensional con re-muestreo dirigido a redes neuronales artificiales y árboles clasificadores. (Doctorado en Ciencias Económicas). Instituto Politécnico Nacional, Sección de Estudios de Posgrado e Investigación, Escuela Superior de Economía, México.
Abstract: RESUMEN: En este trabajo se analiza la relación entre las diferentes dimensiones de la globalización y la desigualdad en el ingreso. La cual ha aumentado en la mayoría de los países, algunos autores lo atribuyen a los procesos de globalización, sin embargo, no parece haber un conceso en la literatura. Los resultados empíricos de las diversas investigaciones dependen del enfoque teórico y de las características de los datos utilizados en el análisis, principalmente del periodo de estudio, de las variables y los países incluidos. Con el objetivo de aportar a este debate, se analiza dicho fenómeno con un enfoque de ciencia de datos, bajo la hipótesis de que los efectos dependen de las características macroeconómicas de cada país en combinación con los distintos factores de la globalización. Para tal propósito, se utiliza el análisis de sensibilidad de las redes neuronales artificiales (RNA) el cual permite identificar los factores más importantes en la dinámica de la desigualdad; también se utiliza el análisis de las reglas de conocimiento dadas por un árbol de clasificación (CART) para analizar situaciones en las cuales aumenta o disminuye la desigualdad ante aumentos de la globalización. Estas herramientas también consideradas de minería de datos, captan relaciones no lineales desde un enfoque no paramétrico, sin embargo, suelen tener problemas de sobreajuste e inestabilidad derivados de la aleatoriedad en los parámetros iniciales. Por lo que se propone un algoritmo (RM-CSR-VN) para seleccionar el mejor modelo, a través del re-muestreo dirigido con y sin reemplazo (Bootstrapping). El re-muestreo dirigido depende de la importancia de las variables en modelos anteriores, con base en lo cual va descartando la variable que menos aporta, dada la importante pérdida de información en la base de datos analizada. ABSTRACT: This paper analyzes the links between the different dimensions of globalization and income inequality. The inequality has increased in most countries, and some authors have attributed it to globalization processes, however, there is no accord in literature. The empirical results of the investigations depend on the theoretical approach and the data characteristics used in the analysis, mainly the study period, the variables and the countries included. In order to contribute to this debate, this phenomenon is analyzed with a data science approach, under the hypothesis that the effects depend on the macroeconomic characteristics of each country combined with the different factors of globalization. For this purpose, the sensitivity analysis of artificial neural networks (RNA) is used, which allows identifying the most important factors in the inequality dynamics. The analysis of the knowledge rules given by the classification tree (CART) is also used to analyze situations in which inequality increases or decreases in the face of increases in globalization. These tools, also considered part of data mining, capture non-linear relationships from a non- parametric approach, however, they often have problems of over-fitting and instability, driven by randomness in the initial parameters. Therefore, an algorithm (RM-CSR-VN) is proposed to select the best model, through re-sampling directed with and without replacement (Bootstrapping). The directed re-sampling depends on the importance of the variables in previous models, based on which it discards the variable that contributes less, given the significant loss of information in the analyzed database.
Description: Tesis (Doctorado en Ciencias Económicas), Instituto Politécnico Nacional, SEPI, ESE, 2019, 1 archivo PDF, (93 páginas). tesis.ipn.mx
URI: http://tesis.ipn.mx/handle/123456789/30316
Appears in Collections:1. Tesis

Files in This Item:
File Description SizeFormat 
Tesis Parada Rojas Ana Cecilia.pdfTesis de doctorado3.93 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.