Soutenance de thèse de Lionel DROZ-BARTHOLET le lundi 6 février 2012 à 14 h , amphi FEMTO-ST



Résumé :

La tolérance aux pannes est assez rare dans les systèmes collaboratifs [Qin01, Gut10] et
la plupart d’entre eux reposent sur une architecture centralisée [Wei09]. De ce fait une seule
panne (nœud ou communication) peut rendre caduque tout un système. Nous présentons ici un
noyau de collaboration (appelé Calipso) totalement distribué, hautement tolèrant aux pannes
et garantissant la cohérence des données partagées ainsi que la vivacité des écritures. Ces
garanties sont conservées en dépit de l’asynchronie du système, des pannes de nœuds et/ou des
communications, des pertes de messages, des duplications de message ou du réordonnancement
des messages si une minorité de nœuds reste actifs. Ces garanties reposent sur l’agglomération
de deux approches qui sont la réplication et la reconfiguration. La première permet de construire
un système robuste en augmentant la disponibilité de la mémoire et la seconde permet de pallier
l’accumulation de pannes dans le système. Le système d’écriture et de reconfiguration de Calipso
repose sur un algorithme de consensus qui permet à un ensemble de nœuds de s’accorder sur une
valeur commune. La fusion de ces deux opération permet de tolérer des évènements dynamiques
(tels que l’ajout et le retrait de participants) sans perturber la session de collaboration en cours.
La propriété de séquentialité est prouvée et un prototype de test a été développé et intégré dans
une plate-forme de collaboration médicale pour valider son utilisation.

Directory