Recomendación de sitios turísticos con base en la detección de sentimientos de emociones recuperadas en Twitter

Borráz López, Vanessa

DSpace Home
→
3.- Unidades Académicas de Nivel Posgrado
→
Centros de Investigación y Posgrado
→
CIC
→
1. Tesis
→
View Item

dc.contributor.author	Borráz López, Vanessa
dc.date.accessioned	2020-01-23T16:55:41Z
dc.date.available	2020-01-23T16:55:41Z
dc.date.created	2019-06-06
dc.date.issued	2020-01-09
dc.identifier.citation	Borráz López, Vanessa. (2019). Recomendación de sitios turísticos con base en la detección de sentimientos de emociones recuperadas en Twitter (Maestría en Ciencias de la Computación). Instituto Politécnico Nacional, Centro de Investigación en Computación, México.	es
dc.identifier.uri	http://tesis.ipn.mx/handle/123456789/27765
dc.description	Tesis (Maestría en Ciencias de la Computación), Instituto Politécnico Nacional, CIC, 2019, 1 archivo PDF, (77 páginas). tesis.ipn.mx	es
dc.description.abstract	RESUMEN: Esta investigación se realizó con el apoyo de herramientas y algoritmos como: API Stream de Twitter, base de datos NoSQL MongoDB, algoritmo Support Vector Machine SVM (tfidf, bag of words), K-Fold Cross Validation, el micro framework Flask y la base de datos DBpedia, trabajando en conjunto sobre un sistema operativo Linux. Estas herramientas en conjunto realizaron un estudio del comportamiento de la información de usuarios viajeros en Twitter, para generar un reporte de ayuda en la toma de decisiones en futuros viajes del turismo mexicano de una forma más fácil y organizada, de la siguiente manera: API Stream operó en la recopilación de tweets en tiempo real de cuentas de viajeros de Twitter, para la generación de corpus durante 6 meses; para ello, se necesitó de una base de datos MongoDB NoSQL, para el manejo y guardado de datos JSON. SVM se considera una parte fundamental para esta tesis, debido al uso de una gran cantidad de tweets; SVM ayudó a verificar el trabajo humado (Aprendizaje Supervisado) y así, con mayor certeza clasificar tweets como se deseaba; lográndose hacer más legible el contenido de los tweets, debido a la normalización de datos que se aplicó para el mejor funcionamiento del algoritmo. Para darle un uso práctico y claro a éste trabajo, se decidió mostrar la información procesada en forma de reporte Web; lo cual llevó al uso de otras herramientas como la base de datos BDPedia (se usó para vincular la información de tweets con estados mexicanos u otros países o lugares) y el micro framework Flask (se usó para consultar y mostrar la información de una forma ágil a los usuarios finales). Finalmente, se genera “Reporte para Viajeros MX” que permite tener una idea real y resumida de las vivencias que han tenido personas en el mundo, que comparten sus experiencias en las redes sociales. Los resultados finales muestran que a partir de un corpus generado de Twitter se obtuvo un reporte web, en el cual se observa que empleando el algoritmo SVM con aprendizaje supervisado se obtiene la información de mayor utilidad para usuarios que tomen como guía éste trabajo para conocimiento propio o bien para planificar sus viajes en México. La clasificación y entrenamiento con SVM y el empleo de la base de datos DBpedia para organizar la información procesada por estados mexicanos, muestran finalmente un reporte con recomendaciones organizadas y con consultas rápidas de recomendaciones a destinos mexicanos de su elección. Como trabajos futuros, empleando la misma metodología, se podría mejorar éste trabajo no limitando la información en México, si no tal vez en los destinos turísticos mayormente recomendados a nivel mundial e incluso obteniendo el corpus de una manera distinta a la que se obtuvo en éste trabajo o tomando en cuenta el procesamiento de imágenes o video de modo que se obtenga mayor información de utilidad para tener un panorama más amplio de las opiniones de ayuda de viajeros de Twitter. ABSTRACT: This investigation was realized with tools and algorithms like Stream API, MongoDB database NoSQL, SVM algorithm (tfidf, bag of words), K-Fold Cross Validation, the micro framework Flask and DBpedia database, all of this working together in an operative system Linux. The above tools were used in an information analysis of traveler users that was extracted from Twitter to generate an organized, easy and helping report in the decisions making in future trips of Mexican tourism like follow: Stream API worked in real time for collect and save each event executed of the 3 different Twitter accounts for a period of 6 months in MongoDB. SVM is considerate a fundamental part for this thesis work because it helps in the machine learning process using the obtained corpus; SVM with K-fold cross validation help to verify a good supervised learning work and thus, whit greater certainty categorize or section the tweets as desired; getting more legible the tweets content for the use of normalization in the corpus. Getting a practice use and clear for this work, the information processed was showed like a report; this help to use other tools as BDpedia database (It was use to link tweets with Mexican states and other countries or places) and the micro framework Flask (This was use to consult and show information more fast and agile for the end users). Finally, is generated a report call “Reporte para Viajeros MX” that It has a resume and real idea of people experiences who have had traveling around the world and they decided share it with all the world. The final results show that from a generated Twitter corpus, a web report was obtained; in which it´s observed that using an SVM algorithm with supervised learning we can obtain the usefullest information for users that use this information for their travels or own knowledge. The classification, the training with SVM and the use of DBpedia database for organize processed Mexican information, finally show a report with organize recommendations and fast consultations of Mexican destinations of your choice. Like a future works, thinking in the same idea and with the same technology this work could be better without limiting the information to Mexico, probably could be addressed to the places with more tourism in the world, inclusive getting the corpus of a distinct manner taking into account the information of images and videos for generation of the corpus.	es
dc.language.iso	es	es
dc.subject	Procesamiento de lenguaje natural	es
dc.subject	Aprendizaje automático	es
dc.subject	Inteligencia artificial	es
dc.subject	Redes sociales	es
dc.title	Recomendación de sitios turísticos con base en la detección de sentimientos de emociones recuperadas en Twitter	es
dc.contributor.advisor	Orantes Jiménez, Sandra Dinora