Diseño de un sistema de control de vehículos autónomos mediante aprendizaje por refuerzo con garantías de seguridad
Resumen
Los métodos de control convencionales presentan limitaciones para responder de forma eficaz en entornos cambiantes e inciertos, lo que impulsa el desarrollo de enfoques más seguros y adaptativos. No obstante, validar estas soluciones directamente en escenarios reales implica altos costos y largos tiempos de validación, por lo que se deben explorar métodos alternativos. El presente proyecto consiste en el desarrollo de un sistema de control para vehículos autónomos mediante aprendizaje por refuerzo profundo. Se implementó un modelo dinámico vehicular validado en la plataforma Webots, que permitió entrenar un agente capaz de mantenerse dentro del carril, evitar colisiones y regular su velocidad. Posteriormente, se desarrolló un sistema de percepción basado en visión por computadora, encargado de detectar carriles y estimar variables como la desviación lateral, ángulo de conducción, la curvatura de la vía, así como la distancia y velocidad a otros vehículos, las cuales fueron validadas estadísticamente. El sistema completo fue evaluado en un entorno tridimensional simulado, mostrando un buen desempeño general durante su validación, con una desviación máxima de 0.73 m y un error máximo del ángulo de conducción de 0.28 rad. Conventional control methods show limitations in effectively responding to dynamic and uncertain environments, which drives the development of safer and more adaptive approaches. However, validating these solutions directly in real-world scenarios involves high costs and long validation times, making it necessary to explore alternative methods. This project focuses on the development of a control system for autonomous vehicles using deep reinforcement learning. A dynamic vehicle model was implemented and validated in the Webots platform, enabling the training of an agent capable of staying within its lane, avoiding collisions, and regulating speed. Subsequently, a perception system based on computer vision was developed to detect lanes and estimate variables such as lateral deviation, heading angle, road curvature, and the distance and speed of surrounding vehicles. These measurements were statistically validated. The complete system was evaluated in a simulated three-dimensional environment, showing good overall performance during validation, with a maximum lateral deviation of 0.73 m and a maximum heading angle error of 0.28 rad.
Descripción
Proyecto de Graduación (Licenciatura en Ingeniería Mecatrónica) Instituto Tecnológico de Costa Rica, Escuela de Ingeniería Mecatrónica, 2025.
Compartir
Métricas
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia:


