Abstract:
RESUMEN: En el presente documento se propone la construcción de un prototipo de robot móvil portero, el cual será entrenado virtualmente empleando un algoritmo de aprendizaje por refuerzo. La propuesta consiste en llevar a cabo el entrenamiento en un entorno virtual en un motor de desarrollo de aplicaciones. Una vez generado el aprendizaje, se implementará en el robot usando una aplicación móvil que se comunicará con los sensores y actuadores por medio de comunicación inalámbrica. El diseño del prototipo consiste en un robot de cuatro ruedas con direccionamiento diferencial, un celular con sistema operativo Android que fungirá como cerebro y proporcionará la cámara para que el robot pueda ver el detectar el balón, y una placa de desarrollo para el comunicar las decisiones tomadas por el entrenamiento. El algoritmo de aprendizaje por refuerzo que se aplicará es el de Optimización de Políticas Proximales, el cual se implementará utilizando una herramienta compatible con el motor de desarrollo.
El objetivo principal de este proyecto es proveer una estrategia de entrenamiento de un robot móvil a través de una plataforma virtual, reduciendo así las tareas en una plataforma experimental y evitando desgaste y tiempos de entrenamiento físico del robot.
ABSTRACT: This document proposes the construction of a goalkeeper mobile robot, which will be trained virtually using a reinforcement learning algorithm. The proposal consists in performing the training in a virtual environment in a game engine. Once the learning has been generated, it will be implemented in the robot using a mobile application that will communicate with the sensors and actuators through wireless communication.
The design of the prototype consists of a four-wheeled robot with differential steering, a smartphone with Android operating system that will act as the brain and provide the camera so that the robot can see the ball movement, and a development board for communicating the decisions sent by the training. The reinforcement learning algorithm that will be applied is Proximal Policy Optimization, which will be implemented using a tool compatible with the engine. The main objective of this project is to provide a training strategy for a mobile robot through a virtual platform, thus reducing the tasks on an experimental platform and avoiding wear and physical training times for the robot.
Description:
Trabajo terminal (Ingeniería Mecatrónica). Instituto Politécnico Nacional, UPIITA, 2022, 1 archivo PDF, (171 páginas). tesis.ipn.mx