PCA, PRA, MCO, RPO, RTO, euh… mais c’est pas un peu la même chose tout ça ?

Les événements actuels ont mis à l’épreuve certains services des entreprises, nous allons nous attarder sur le système d’information, c’est le nerf de la guerre pour beaucoup d’organisations et c’est aussi ma spécialisation.

Nous allons déjà établir un glossaire sur les différents acronymes :

PCAPlan de Continuité d’Activté
PRAPlan de Reprise d’Activité
MCOMaintien en Condition Opérationnel
RPORecovery Point Objective / Perte de Données Maximale Admissible (PDMA)
RTORecovery Time Objective / Durée Maximale d’Interruption Admissible (DMIA)
Acronymes et définitions

RTO – Durée Maximale d’Interruption Admissible (DMIA)

Le RTO est un objectif, pour l’atteindre, de nombreuses organisations définissent des solutions types en fonction des délais de reprise attendus. Il s’agit donc bien d’un délai de base, il est utilisé dans la mise en place d’un PRA ou PCA, de même que le RPO, et c’est ce qui permet d’orienter l’entreprise sur son choix de PRA. En effet plus le délai sera court, plus les moyens à mettre en oeuvre seront conséquents, en gros plus le RTO est court, plus ça va coûter cher.

De mon point de vue c’est une notion très importante à faire comprendre aux décisionnaires, car déjà il faut admettre qu’il va y avoir des interruptions de service et nous devons mettre en place des mesures en accord avec les objectifs fixés par la stratégie de l’entreprise. Bien évidemment le RTO pourra / sera différent suivant les services (mail, paie, ressources humaines, compta, fichiers, métiers, etc.)

Si vous définissez des RTO différents suivant les services de votre organisation, il faudra prendre le RTO le plus long et le majorer des autres RTO pour obtenir un RTO sur l’entièreté de l’entreprise. Si au début cela peut sembler empirique, avec l’expérience et les exercices de mise en pratique, il évoluera et s’ajustera.

RPO – Perte de Données Maximale Admissible (PDMA)

La perte de données maximale admissible, en anglais RPO quantifie les données qu’un système d’information peut être amené à perdre par suite d’un incident. Usuellement, elle exprime une durée entre l’incident / sinistre provoquant la perte de données et la date la plus récente des données qui seront utilisées en remplacement des données perdues. Cette durée est exprimée généralement en heures ou minutes.

Le RPO est souvent déterminé par la fréquence et la nature des sauvegardes effectuées sur les ressources informatiques. Toutefois, les données utilisées en remplacement des données perdues ne proviennent pas nécessairement d’une sauvegarde/restauration. Elles peuvent par exemple être reconstruites à partir de journaux de transactions, être issues d’une réplication, d’une copie ou d’un rejeu différé…

Tout comme le RTO, le RPO permet de faire comprendre qu’en cas de crash nous pouvons perdre des données, certains considèrent que c’est une perte d’intégrité, car les données ne seront plus « justes » avec la réalité, si nous prenons l’exemple des transactions bancaires l’impact serait terrible…

C’est le cas typique où l’on devient paranoïaque et que l’on en arrive à du « ceinture, bretelles, épingle à nourrice, corde à linge, élastique … » c’est aussi pour cela que l’on voit que les bases de données transactionnelles ont de beaux jours devant elles, je vous invite à approfondir les quatre propriétés ACID qui est un acronyme résumant les quatre propriétés élémentaires d’une transaction au sein d’une base de données : Atomicité, Cohérence, Isolation, Durabilité. De par mon expérience j’ai déjà rencontré des DBA qui reconstruisent des données à partir des journaux de transaction des SGBD (Système de gestion de base de données) en cas de corruptions, il existe aussi des mécanismes intégrés aux SGBD pour contrôler et restaurer automatiquement la cohérence des données.

RPO & RTO

MCO – Maintien en Condition Opérationnel

Le MCO est l’ensemble des mesures prises pour garantir de la résilience : la capacité à encaisser des incidents « mineurs » sans impact fort sur la qualité de service habituelle. Dans le cadre d’un PCA, le MCO couvre la stratégie de sauvegarde utilisée et la méthodologie de déploiement de celle-ci sur un environnement dégradé, de la réplication de la configuration des équipements, mais aussi, dans le cadre d’une production continue, du remplacement des pièces défectueuses, du diagnostic des pannes, de la formation et de la documentation.

L’exemple en cohérence avec l’actualité a été pour beaucoup d’entreprises de basculer tous les collaborateurs pour lesquels cela a été possible, en télétravail, ici le fait de ne pas pouvoir venir travailler n’est pas un impact majeur, car ces entreprises avaient déjà les moyens techniques en place, il a juste suffi de les activer et/ou configurer. A contrario s’il avait fallu déployer des moyens techniques dans l’urgence pour permettre ce télétravail, là nous aurions été dans un PCA.

PRA – Plan de Reprise d’Activité

Le PRA est une procédure qui permet aux entreprises de reprendre vite leurs activités après avoir vécu un sinistre majeur (inondation, incendie, perte de données vitales, etc.), il s’agit d’un document qui décrit les démarches à suivre afin de reconstruire son système d’information et de minimiser les effets négatifs. Ici ce n’est pas une méthode, c’est vraiment comme une documentation technique à suivre pas à pas avec des actions à réaliser et des étapes à suivre, il est fortement recommandé de jouer son PRA au moins une fois par an pour que les équipes soient prêtes le jour « J ».

Le PRA permet donc de répondre à un risque avec impact à long terme : Fournir une procédure pour assurer un redémarrage ordonné et aussi rapide que possible les activités essentielles de l’entreprise en cas d’incident majeur/catastrophe.

PCA – Plan de Continuité d’Activé

Le PCA doit assurer la continuité des services de l’entreprise en cas de panne ou d’accident majeur. Ce dernier a pour but aussi de diminuer au maximum le temps d’interruption ainsi que d’éviter les pertes de données. L’objectif du PCA est de répondre à un risque avec impact à court terme : Fournir les procédures nécessaires pour maintenir les activités essentielles de l’entreprise suite à une importante perturbation.

En résumé

Il est essentiel de ne pas confondre PCA et MCO, le PCA est vraiment orienté pour les pannes majeures alors que le MCO c’est pour le « courant » de tous les jours. Le PRA est aussi souvent associé avec le PCA, car ils sont tous les deux sur des cas de sinistres très impactant, à ceci près que le PCA est sur du court terme alors que le PRA est sur du long terme, par exemple activé un site de repli implique le déménagement des personnels, c’est quelque chose qui va durer facilement plusieurs jours, le temps de rétablir le site principal, ce n’est pas l’affaire de quelques heures.

Bref nous voyons bien que le but est de maintenir la continuité du système d’information et cela peut passer par une reprise après une interruption plus ou moins longue avec une possible perte de données.

  • MCO : maintenir sur impact « mineur », le plus courant dans un service informatique finalement, remplacer un disque dur, ouvrir un accès VPN pour un collaborateur à distance, nœud d’un cluster qui tombe, remplacement d’un équipement réseau, mais aussi restauration temporaire sur un environnement dégradé pour maintenir le service, ici il y du suivi de procédure et de la manipulation par des administrateurs ;
  • PRA : reprise de l’activité après un crash majeur (notion de RTO et RPO) avec un impact à long terme, un incendie sur le site principal qui oblige le déménagement vers un site de repli par exemple, ici il y du suivi de procédure et de la manipulation par des administrateurs et des opérateurs ;
  • PCA : assurer la continuité d’activité avec un accident majeur, la perte du local technique n°1 avec la bascule automatique sur le local technique n°2 par exemple. Celle-ci peut/doit être automatique.

, , , ,
Article précédent
Clusif – le livre blanc à l’usage des dirigeants
Article suivant
Awesome ressources

Articles liés

Aucun résultat.

Menu