Devenir SysAdmin d’une PME, retour d’expérience - Billet n°0

D 18 mai 2018 H 09:00 A Genma C 3 messages

TAGS : Planet Libre Sysadmin Tutoriaux Devenir SysAdmin d’une PME

Introduction

Depuis mes débuts sous Linux, j’ai toujours su taper des commandes. Très tôt, j’ai appris à installer différents services et des serveurs (essentiellement dans des machines virtuelles et pour faire du LAMP : Linux, Apache, MySQL, PHP), mais c’est toujours resté de la bidouille. Avec le début de mon autohébergement fin décembre 2015, j’ai commencé à m’intéresser aux problématiques d’administration système. A l’été 2016, pendant les vacances, j’ai mes débuts véritable en sysadmin - administration système en cherchant à comprendre comment fonctionnait Yunohost dans ses entrailles, les différents services, en cassant et restaurant sans soucis à plusieurs reprises mon instance de production... J’ai donc appris et pas mal progressé à titre personnel, en gérant mon instance Yunohost, soit un seul serveur.

Pourtant, à côté, j’ai continué à m’intéresser à une gestion plus professionnelle et industrielle et en début de cette année 2018, je me suis vu affecter la reprise de la gestion de toute l’infrastructure de la société dans laquelle je travaille. Cette prise de fonction et de responsabilité a été décidé dans le cadre d’une restructuration des services : gérer les services de production, de support et d’infrastructure interne et liée à nos clients permet d’avoir une meilleur vision d’ensemble, plus de réactivité...

Comme toute nouvelle prise de fonction, les précédentes personnes ayant eu à gérer le service sont parties faire d’autres horizons bien qu’une passation de connaissances s’est faite, elle s’est faite rapidement.

Et avec les semaines, on découvre que même si une documentation existe (répartie dans plusieurs wikis), elle n’a pas été maintenue à jour, n’est pas assez détaillée ou obsolète... Et avec le temps il y a des choses qui marchent mais on ne sait pas comment, il y a des serveurs qu’on ne touche pas, des services qui tournent alors on ne touche à rien. Tout cet héritage et empilage de choix technique mis en place avec les années par les différents administrateurs systèmes qui se sont succèdés, c’est ce que j’appellerai le legacy, soit l’héritage.

Contexte de l’infrastructure Je pense qu’il est important, pour la suite des billets que j’aurai à rédiger, de préciser, que l’infrastructure actuelle se compose de trois grandes catégories de machines et ces catégories ont leurs importances :
– Les machines physiques : 99% des serveurs sont sous Debian, dans différentes versions
– Les machines virtuelles sur un hyperviseur : Xen et Proxmox
– Les machines cloud (sur l’hyperviseur d’un autre)

Un travail de modernisation avec le passage à des technologies plus évolutives et flexibles (virtualisation, Docker / K8S Kubernetes...) a été débuté mais il reste encore beaucoup de "une machine physique ou virtuelle pour un service dédié" avec autant de système d’exploitations et d’applications à maintenir et à découvrir...

Je pense que je ferai là encore, une série de billets au fur et à mesure de ma progression et sur comment j’ai commencer à dresser une cartographie détaillé de l’existant, documenter de novo en reprenant TOUTE la documentation existante pour la remettre d’aplomb... Et dans le futur, je parlerai de mon expérience dans la mise en place de nouveau service, dans la refonte et modernisation de l’infrastructure...

L’objectif de ma série de billets ces prochains mois sera le partage de mon expérience acquise avec le temps, le partage de bonnes pratiques mises en places, d’astuces etc. En complément de ma série de billets plus spécifiques sur le projet Chatonkademy.

Les commandes que j’utilise le plus

Pour finir ce premier billet un peu fourre-tout, je voudrais parler des commandes que j’utilise le plus au quotidien. A l’heure actuelle, quand l’outil de supervision (sous Zabbix) remonte des alertes, je me connecte en SSH sur les machines et voici les commandes que j’utilise le plus :
– ncdu
– ls -lrtu
– tail -f /var/log/le_fichier_de_log_qui_va_bien

ncdu Habitué de la commande du dont je ne me rappelle jamais les options pour avoir uniquement le niveau 1 (réponse du -h —max-depth=1 .), j’ai découvert et depuis je ne m’en passe plus et l’installe sur tous les serveurs la commande ncdu, soit NCurses Disk Usage. Simple, rapide et efficace, on a de suite l’espace disque occupé par un répertoire. Pratique pour de suite savoir quel dossier prend plein de place, et c’est très complémentaire à du, en ajoutant en plus un système de navigation au clavier dans l’arborescence scannée. Indispensable.

ls -lrtu on liste les fichiers et on les trie par date pour de suite avoir en base de liste les derniers fichiers modifiés. Pratique pour savoir quel est le dernier fichier de logs qui vient d’être modifié (c’est le dernier de la liste), voir quel est le propriétaire et la date et heure de dernière écriture.

Pour ensuite faire dessus le classique

tail -f /var/log/le_fichier_de_log_qui_va_bien J’ai dans les projets pour les mois à venir la mise en place d’un système de gestion des logs centralisés mais en attendant, à l’ancienne, je consulte les logs avec un tail -f et éventuellement du |grep motif_qui_va_bien pour filtrer affiner un peu.

Et pour le reste, il y a les commandes que j’évoquais dans mes billets :
– Yunohost - Supervision en ligne de commande
– Yunohost - Supervision du trafic réseau

Dans la même rubrique

17 décembre 2019 – Usage du preseed pour faciliter l’installation de ses serveurs Debian

18 septembre 2019 – Devenir SysAdmin d’une PME - Quelques outils et scanners de vulnérabilités

13 septembre 2019 – Devenir SysAdmin d’une PME - Reprise des billets

14 novembre 2018 – Devenir SysAdmin d’une PME - De l’importance de l’expérience

12 novembre 2018 – Devenir SysAdmin d’une PME - De l’importance du retex suite à un incident

3 Messages

Devenir SysAdmin d’une PME, retour d’expérience - Billet n°0, sébastien | 23 mai 2018 - 16:32 1

Marrant car je me trouve un peu dans la même situation mais sur la gestion et l’administration d’un parc de données géographiques en tant qu’ADL, avec des serveurs répartis sur plusieurs sites et des données un peu partout. pas forcément le même sujet mais la même problématique d’un manque cruel d’info, des trucs qui fonctionnent pas, des trucs qui fonctionnent mais on ne sait pas comment donc faut surtout pas y toucher, des trucs à jour, d’autres dont on ne sait rien donc au cas où on laisse...
Bref je vais lire les prochains articles avec attention car pas mal de choses pourront être transposés.
Devenir SysAdmin d’une PME, retour d’expérience - Billet n°0, Luc | 4 juin 2018 - 09:24 2

tail -f … multitail you should use, young padawan ;-)
Devenir SysAdmin d’une PME, retour d’expérience - Billet n°0, will | 6 juin 2018 - 10:15 3

Bonjour.

Tout d’abord, merci pour ce rappel sur ncdu, commande faisant partie de la tonnes de commandes sur mon propre système, mais oubliée au tréfonds de mon cerveau ; je suis plus du, utilisable sur les *NI|UX.
Du coup, je viens de la (re)découvrir. Plus pratique que le du | less ou (pire) du | more.

Pour le ls, je suis plus ls -ail avec parfois les options rt.
Du coup, le tout est placé en alias.

Bon continuation.