La réplication de données est un mécanisme clé pour construire des systèmes de gestion de données fiables et efficaces. En conservant plusieurs copies pour chaque donnée, il est possible d’améliorer la durabilité des données et/ou les performances d’accès à ces données. Cependant, avoir plusieurs copies d’une même donnée peut engendrer des problèmes de cohérence en cas de mises-à-jour. Dans ce séminaire, nous présenterons un aperçu des principaux problèmes auxquels on doit s’attaquer lorsque que l’on conçoit un système de gestion de données  distribué. Nous aborderons ensuite des contributions dans le domaine de la tolérance aux fautes (durabilité et disponibilité des données) et de la performance (placement des copies des données). Enfin, nous ferons un zoom sur des travaux en cours : le placement des données au sein de systèmes de gestion de données offrant plusieurs niveaux de cohérence de données.

Title : Data replication in large-scale distributed systems
 
Abstract : Data replication is a key mechanism for building a reliable and efficient data management system. Indeed, by keeping several replicas for each piece of data, it is possible to improve data durability and/or access performance. However, having multiple copies of a single piece of data may induce data consistency issues when the data is updated. In this presentation, we will present an overview of the main problems that need to be tackled while designing a distributed storage system. We will then introduce several contributions in the area of fault tolérance (data durability/availability) and performance (data placement). Finally, we will focus on our current research topic: data placement in data management systems offering multiple data-consistency levels.
Commence le
Finit le
Europe/Paris