Detección de regiones de café en imágenes aéreas de plantaciones costarricenses
Resumen
El Instituto del Café de Costa Rica (ICAFÉ) se encuentra trabajando en un programa que tiene por objetivo proveer al sector cafetalero nacional con semilla certificada. Al ser un proceso manual, el consumo de recursos que este programa demanda actualmente representa una oportunidad de mejora mediante técnicas de aprendizaje profundo en imágenes aéreas, como parte del desarrollo de un proyecto innovador en dos etapas: la detección de cultivos de café y su respectiva clasificación varietal. En este trabajo se propone un algoritmo de aprendizaje profundo para la identificación de las regiones correspondientes a plantaciones de café en imágenes aéreas. La metodología definida para dicha identificación corresponde a la detección de anomalías. Para esto se ha diseñado un autocodificador convolucional, como la arquitectura de red neuronal seleccionada para clasificar regiones como plantaciones de café o como anomalías. El proceso de entrenamiento del autocodificador se desarrolló utilizando exclusivamente sub-imágenes cuyo contenido corresponde a plantas de café, bajo un esquema generativo de aprendizaje no supervisado. La experimentación se basó principalmente en modificaciones al tamaño del espacio latente del autocodificador, utilizando 128, 256 y 512 dimensiones para generar tres modelos diferentes y evaluar su capacidad de reconstrucción de las sub-imágenes, así como la separación de los datos entre regiones que corresponden a plantaciones de café y las regiones consideradas como anomalías. Para la clasificación de dichas regiones, se utilizó una Máquina de Soporte Vectorial (SVM) a la salida de los codificadores de los tres modelos. El entrenamiento de los tres modelos convergió hacia valores de pérdida inferiores al 19 % y hacia valores de exactitud superiores al 81 %. Se generaron gráficos de dispersión de baja dimensionalidad, donde fue posible observar un traslape inferior al 50 % entre los conjuntos de datos del espacio latente correspondientes a café y anomalías, que en su mayoría representan secciones de otras plantas. También se realizó un análisis estadístico del error de reconstrucción con los tres modelos de autocodificador, donde se determinó que el menor traslape se obtiene cuando dicho error es calculado sobre la sub-imagen RGB original concatenada horizontalmente con su versión filtrada utilizando el algoritmo LBP. Como resultados cualitativos, se reconstruyeron cuatro mosaicos completos que representan escenarios agrícolas a partir de las sub-imágenes clasificadas, donde se identificó que la precisión de los resultados depende de factores como la iluminación, las sombras y la altura a la que se capturaron dichos mosaicos. Los resultados sugieren la necesidad de mejorar la precisión de la clasificación de regiones, donde se deberán explorar métodos supervisados y utilizar imágenes con más información que permitan mejorar la separación entre las sub-imágenes de café y las sub-imágenes de otras plantas visualmente similares. The Costa Rican Coffee Institute (ICAFÉ) is currently working on a program that aims to provide the national coffee sector with certified seed. Being a manual process, the consumption of resources that this program currently demands represents an opportunity for improvement, through deep learning techniques in aerial images as part of the development of an innovative project in two stages: the detection of coffee crops and their respective varietal classification. In this work, a deep learning algorithm is proposed for the identification of regions corresponding to coffee plantations in aerial images. The methodology defined for such identification corresponds to the detection of anomalies. For this purpose, a convolutional autoencoder has been designed as the neural network architecture selected to classify regions as coffee plantations or as anomalies. The training process of the autoencoder was developed using exclusively sub-images whose content corresponds to coffee plants, under a generative unsupervised learning scheme. The experimentation was mainly based on modifications to the size of the latent space of the autoencoder, using 128, 256 and 512 dimensions to generate three different models and evaluate its capacity to reconstruct the sub-images, as well as the separation of the data between regions corresponding to coffee plantations and regions considered as anomalies. For the classification of these regions, a Support Vector Machine (SVM) was used at the output of the encoders of the three models. The training processes of the three models converged to loss values below 19 % and accuracy values above 81 %. Low dimensionality scatter plots were generated, where it was possible to observe less than 50 % overlap between the latent space data sets corresponding to coffee and anomalies, most of which represent sections of other plants. A statistical analysis of the reconstruction error was also performed with the three autoencoder models, where it was determined that the lowest overlap is obtained when such error is calculated on the original RGB sub-image horizontally concatenated with its filtered version using the LBP algorithm. As qualitative results, four complete mosaics representing agricultural scenarios were reconstructed from the classified sub-images, where it was identified that the accuracy of the results depends on factors such as illumination, shadows and the height at which the mosaics were captured. The results suggest the need to improve the accuracy of region classification, where supervised methods should be explored and images with more information should be used to improve the separation between sub-images of coffee and sub-images of other visually similar plants.
Descripción
Proyecto de Graduación (Maestría en Electrónica), Instituto Tecnológico de Costa Rica, Escuela de Ingeniería Electrónica, 2022.
Compartir
Métricas
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: