Comparative analysis of traditional methods and a deep learning approach for multivariate imputation of missing values in the meteorological field
Análisis comparativo de algoritmos tradicionales y un modelo de aprendizaje profundo para la imputación multivariada de valores faltantes en el campo meteorológico
| dc.creator | Arias-Muñoz, Ana Cristina | |
| dc.creator | Cob-García, Susana | |
| dc.creator | Calvo-Valverde, Luis Alexander | |
| dc.date | 2024-06-28 | |
| dc.date.accessioned | 2026-05-18T21:28:28Z | |
| dc.date.available | 2026-05-18T21:28:28Z | |
| dc.identifier | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6746 | |
| dc.identifier | 10.18845/tm.v37i3.6746 | |
| dc.identifier.uri | https://hdl.handle.net/2238/18184 | |
| dc.description | Climate observations are the groundwork for several real-world applications such as weather forecasting, climate change monitoring and environmental impact assessments. However, the data is mostly measured and recorded by external devices exposed to numerous variables, causatives of malfunctions and, therefore, missing values. Nowadays, data imputation in the time series field has been researched in depth and a wide variety of methods have been proposed, where traditional classification and regression algorithms predominate, even though there are also deep learning approaches that manage to capture temporal relationships between observations. In this article, a comparative analysis between a classification imputation algorithm, a regression imputation algorithm, and a deep learning imputation model is made: MissForest algorithm, based on random trees; Expectation Maximization with Bootstrap (EMB), the maximum likelihood estimation algorithm; and a proposed deep learning model, based on the Long-Short Term Memory (LSTM) architecture. Data from the Costa Rica meteorological field were used, which consist of multivariate data coming from several weather stations in the same geographical area. | en-US |
| dc.description | Las observaciones climáticas son la base para varias aplicaciones del mundo real, como el pronóstico del tiempo, el monitoreo del cambio climático y las evaluaciones de impacto ambiental. Sin embargo, la mayoría de los datos son medidos y registrados por dispositivos externos expuestos a numerosas variables, causantes de mal funcionamiento de los dispositivos y, por lo tanto, de los valores faltantes. En la actualidad, se ha investigado en profundidad la imputación de datos en el campo de las series temporales y se han propuesto una gran variedad de métodos, donde predominan los algoritmos tradicionales de clasificación y regresión, no obstante, también existen enfoques de aprendizaje profundo que logran capturar relaciones temporales entre observaciones. En este artículo se realiza un análisis comparativo entre un algoritmo de clasificación, un algoritmo de regresión y un modelo de aprendizaje profundo: algoritmo MissForest, basado en árboles aleatorios; Expectation Maximization with Bootstrap (EMB), el algoritmo de estimación de máxima verosimilitud; y una propuesta de un modelo de aprendizaje profundo, basado en la arquitectura Long-Short Term Memory (LSTM). Se utilizaron datos del campo meteorológico de Costa Rica, los cuales consisten en datos multivariados provenientes de varias estaciones meteorológicas en una misma zona geográfica. | es-ES |
| dc.format | application/pdf | |
| dc.format | text/html | |
| dc.language | eng | |
| dc.language | spa | |
| dc.publisher | Editorial Tecnológica de Costa Rica (entidad editora) | es-ES |
| dc.relation | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6746/7081 | |
| dc.relation | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6746/7240 | |
| dc.rights | Derechos de autor 2024 Revista Tecnología en Marcha | es-ES |
| dc.rights | https://creativecommons.org/licenses/by-nc-nd/4.0 | es-ES |
| dc.source | Tecnología en marcha Journal; 2024: Vol. 37 Núm. 3: Julio-Setiembre 2024 | en-US |
| dc.source | Revista Tecnología en Marcha; 2024: Vol. 37 Núm. 3: Julio-Setiembre 2024 | es-ES |
| dc.source | 2215-3241 | |
| dc.source | 0379-3982 | |
| dc.subject | data imputation | en-US |
| dc.subject | EMB | en-US |
| dc.subject | MissForest | en-US |
| dc.subject | LSTM | en-US |
| dc.subject | time series | en-US |
| dc.subject | imputación de datos | es-ES |
| dc.subject | EMB | es-ES |
| dc.subject | MissForest | es-ES |
| dc.subject | LSTM | es-ES |
| dc.subject | series de tiempo | es-ES |
| dc.title | Comparative analysis of traditional methods and a deep learning approach for multivariate imputation of missing values in the meteorological field | en-US |
| dc.title | Análisis comparativo de algoritmos tradicionales y un modelo de aprendizaje profundo para la imputación multivariada de valores faltantes en el campo meteorológico | es-ES |
| dc.type | info:eu-repo/semantics/article | |
| dc.type | info:eu-repo/semantics/publishedVersion |
Files in this item
| Files | Size | Format | View |
|---|---|---|---|
|
There are no files associated with this item. |
|||
This item appears in the following Collection(s)
-
Tecnología en Marcha [1993]
Es una revista que se publica por trimestres

