11 décembre 2024

Un disjoncteur qui brûle… et 36 heures d’arrêt pour les CCP : La « leçon » à retenir

La continuité de service a déjà fait l’objet de séminaires et autres colloques où à chaque type d’incident est associé un délai de dépannage, un objectif de correction des incidents dans ces délais et un seuil de non acceptabilité
En tant que système centralisé et n’ayant pas de redondance, le système des CCP s’est arrêté brusquement pendant plus de 36 heures. Moussa Benhamadi est revenu sur ce problème lors d’un entretien avec le quotidien Horizons où il affirme que « c’est l’une des pannes les plus bêtes qu’on puisse imaginer. Un disjoncteur sur l’armoire de distribution qui alimente directement les machines a grillé […] L’un des fils électriques était simplement mal serré, induisant un mauvais contact qui faisait chauffer le disjoncteur. Ainsi, le réseau principal s’est arrêté, de manière brusque […] Le fournisseur a alors envoyé ses ingénieurs en Algérie et ont constaté que ce n’est pas une panne matérielle mais une panne logicielle, ‘‘ un bug’’ ». En résumé, la machine ayant été arrêtée sans sa procédure d’arrêt ne voulait plus redémarrer. Il a fallu  faire « venir deux ingénieurs de France » et tout est redevenu comme avant. La machine a redémarré et a commencé à exécuter les transactions. Tout en déplorant la non-disponibilité de la redondance, le ministre souligne que « nous devons donc prendre cette panne comme une leçon ». La continuité de service a déjà fait l’objet de séminaires et autres colloques où à chaque type d’incident est associé un délai de dépannage, un objectif de correction des incidents dans ces délais et un seuil de non acceptabilité (délai maximum accepté en cas de dépassement du temps imparti). La continuité de service est avant tout un mode de gestion qui demande des actions ininterrompues dans le temps. Ce mode de fonctionnement appliqué à une unité impose très souvent que les unités en relation doivent également fonctionner en continu et c’est toute la chaîne qui est impliquée. La continuité de services doit faire partie intégrante de l’activité. C’est le cas du fonctionnement des CCP, mais aussi d’un haut fourneau, du contrôle aérien, de la fourniture d’électricité aux entreprises et aux particuliers?  Confrontées à des risques constants, nous sommes dans une zone sismique, menaçant la continuité et la rapidité d’accès à leurs données, les entreprises devraient mettre en place des systèmes assurant la sauvegarde et la duplication de leurs bases ; même s’il le faut à travers le monde, en temps réel ou en décalé.
Le choix fait par le ministère des PTIC est de dupliquer totalement la machine et de l’installer dans un endroit où il y a moins de risques de séisme par exemple et dans le but de parer à des désastres tels que les incendies, les inondations ou encore des pannes électriques prolongées.  Cette deuxième machine qui est exactement la même que celle qui fonctionne doit « démarrer sans que nos fonctionnaires ne s’en rendent compte », souligne-t-il.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *