Data quality metrics for unlabelled datasets in medical imaging

Díaz-Villaplana, Ana Catalina

Data quality metrics for unlabelled datasets in medical imaging

Files

TF10140_BIB314988_Ana_Catalina_Diaz-Villaplana.pdf (1.16 MB)

Date

2024-07

Authors

Díaz-Villaplana, Ana Catalina

Publisher

Instituto Tecnológico de Costa Rica

Abstract

Deep learning models typically require large, labeled datasets for optimal performance. However, in real-world applications such as medical imaging, labeled data can be scarce. Semi-supervised deep learning addresses this challenge by leveraging both labeled and unlabeled data to enhance model accuracy. Most semi-supervised methods assume similar distributions between labeled and unlabeled datasets, an assumption that may not hold in practice. To ensure data quality and consistency, we introduce Mahalanobis-based and Frobenius-based distance measures in the embedding space of the deep learning model to evaluate the similarity between labeled and unlabeled datasets. Our findings reveal that the Mahalanobis-based distance correlates strongly with the accuracy of the popular semi-supervised method MixMatch, whereas Frobenius distance results show inconsistent behavior. Moreover, the proposed approach is significantly more efficient than existing methods in the field.

Description

Proyecto de Graduación (Maestría en Computación) Instituto Tecnológico de Costa Rica, Escuela de Ingeniería en Computación, 2024.

Keywords

Métrica -- Calidad de datos, Conjuntos de datos, Imágenes medicas digitales, Aprendizaje profundo (Aprendizaje automático), Datos etiquetados, Imágenes -- Radiografía, Medición -- Tiempo -- Procesamiento, Rayos X -- Imágenes, Metrics -- Data quality, Datasets, Digital medical images, Deep learning (Machine learning), Labeled data, Images -- Radiography, Measurement -- Time -- Processing, X-rays -- Images, Research Subject Categories::TECHNOLOGY::Information technology::Computer science

URI

https://hdl.handle.net/2238/16498

Collections

Maestría en Computación

Full item page

Data quality metrics for unlabelled datasets in medical imaging

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

See / DOI

Full text

Description

Collections

Endorsement

Review

Supplemented By

Referenced By