Descripción
Desktop Clouds rely on volatile computing resources. For instance, platforms such as cuCloud and UnaCloud run scientific applications in virtual machines exploiting idle resources harvested in computer labs. Regretfully, these resources can be claimed by users, turned off and faulted at any time. The application running on these platforms suffer interference and interruptions that do not occur in dedicated platforms. We have been researching how to deal with these interruptions to increase the platform reliability and support applications running for large periods of time. This paper describes an application of our Global Snapshot Protocol, which can be employed for executing and pausing distributed applications running on desktop clouds. We found that, in these environments, the number of failures caused by desktop users is greater than the caused by hardware and communications. There, when a distributed system running in the virtual machines of a desktop cloud is paused, it can be restored in the same desktops, and successfully finish the application execution.
Los desktop clods dependen de recursos computacionales volátiles. Por ejemplo, plataformas como cuCloud y UnaCloud ejecutan aplicaciones científicas en máquinas virtuales que aprovechan recursos ociosos en salas de cómputo y laboratorios. Lamentablemente, estos recursos pueden ser reclamados por los usuarios, apagados o presentar fallas en cualquier momento. La aplicación que se ejecuta en estas plataformas sufre interferencias e interrupciones que no ocurren en plataformas dedicadas. Nosotros hemos estado investigando cómo enfrentar estas interrupciones para aumentar la confiabilidad de la plataforma y soportar aplicaciones que se ejecutan durante largos períodos de tiempo. Este artículo describe una aplicación de nuestro Protocolo de Snapshot Global, el cual puede emplearse para ejecutar y pausar aplicaciones distribuidas que se ejecutan en desktop clouds. Nosotros encontramos que, en estos entornos, la cantidad de fallas causadas por los usuarios de los computadores de escritorio es mayor que la causada por el hardware y las comunicaciones. Allí, cuando se detiene un sistema distribuido que se ejecuta en las máquinas virtuales de un desktop cloud, nosotros podemos reanudar la ejecución usando los mismos computadores y finalizar exitosamente la ejecución de las aplicaciones.