Le blog de Genma
Vous êtes ici : Accueil » Informatique » GNU/Linux, Logiciels Libres » Devenir SysAdmin d’une PME - De l’importance du retex suite à un (...)

Devenir SysAdmin d’une PME - De l’importance du retex suite à un incident

D 12 novembre 2018     H 09:00     A Genma     C 1 messages   Flattr cet article Logo Tipee

TAGS : Planet Libre Sysadmin

Le retex est l’abréviation du RERTour d’EXpérience. Apprendre de ses erreurs pour ne pas le reproduire et une part importante du travail de sysadmin. Pour éviter de faire et de reproduire une erreur, il y a plusieurs choses à faire et prendre en compte : tirer profit de l’expérience des personnes (ce que j’aborderai dans un autre billet sur le partage d’expérience).

On dit souvent avec humour dans le milieu des administrateurs systèmes travaillant sous Linux : il y a deux types d’administrateurs systèmes, celui qui a déjà fait rm -rf / et celui qui le fera.

Nombreuses sont les occasions de faire des erreurs. Et on aura beau avoir pensé au maximum de cas, il y aura forcément le cas non prévu... Et dans le cas où on est amené à travailler dans une situation d’urgence, on fait au plus vite, et une nouvelle erreur est vite arrivée...

Il est donc important, une fois la situation qui a amené à un incident passée, de comprendre comment on est arrivé dans cette situation, de lancer les chantiers de correction des causes, de documenter ce qui ne l’était pas et d’améliorer ce qui l’était déjà, de définir des procédures permettant d’aller à l’essentiel et de ne pas se poser de questions si l’incident est susceptible de revenir...

Ce retex doit être fait assez rapidement pour ne rien oublier. La consultation de l’historique des commandes passés peut être utile pour voir ce qui a été utile, ce qui a été du tâtonement, ce qui a été une voix sans issue, ce qui a marché et ce qui n’a pas marché...

En résumé, un postmortem a pour objectif de documenter ce qui a mal tourné, ce qui a bien tourné, de décrire ce qui peut être fait pour prévenir la nouvel arrivée de ce type d’incident dans le futur. Et bien évidement, l’objectif est tout sauf de blâmer ou de trouver à qui incombe la responsabilité... Un postmortem passe par le création d’une liste de ce qui ne s’est pas bien passé, avec une chronologie détaillée des actions ayant été réalisées et des problèmes rencontrés.

Pour la prévention de cet incident à l’avenir, chaque problème rencontré doit faire l’objet d’une recommandation et une implication des personnes ayant rencontrées le problèmes et susceptibles de le résoudre.

Et une autre façon de prévenir certains problèmes, c’est la formation et le partage de sa propre expérience auprès des collaborateurs plus jeunes et moins expérimentés. Il faut apprendre de ses erreurs, mais aussi apprendre aux autres ce que nos propres erreurs nous ont appris.

 Les Tags - mots clefs de ce article

logo clef

 Vous aimez cet article? Soutenez le blog et partagez-le ;-)

Logo Tipee Flattr icon  Facebook icon  Twitter icon  Diapora icon   Licence Creative Commons

1 Messages

Un message, un commentaire ?
modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par un administrateur du site.

Qui êtes-vous ?
Votre message

Ce formulaire accepte les raccourcis SPIP [->url] {{gras}} {italique} <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Conférences

Médiathèques vous recherchez un conférencier sur l’éducation populaire et l’hygiène numérique? Jetez un coup d’oeil à mon CV

Date des prochaines conférences?
Cliquer ici

Rechercher sur le blog

Liens

Logo Flattr Logo Gmail Logo Twitter
Logo RSS Logo Linkedin Logo GitHub
Logo Gitlab Logo Mastodon
Logo Diaspora

Soutenir ce blog?

Logo Tipee Logo Liberapay

Licence

Licence Creative Commons

Derniers articles

1.  Retour d’expérience avec Borg comme outil de sauvegarde

2.  Illang : The Wolf Brigade sur Netflix

3.  Un exemple des problématiques de design et d’interface du logiciel libre

4.  Anisong le podcast

5.  Soucis d’encodage dans les noms de fichiers

6.  L’Agent Zabbix qui ne répond plus

7.  Devenir SysAdmin d’une PME - De l’importance de l’expérience

8.  Devenir SysAdmin d’une PME - De l’importance du retex suite à un incident

9.  La série Good Doctor

10.  Nextcloud et l’application Notes


Date de mise à jour :

Le 10 décembre 2018