Le blog de la DSI de Télécom Paris

Toute l'information sur les mises en service, les incidents, la maintenance, les courriers malveillants etc.

Arrêt des services Homes et Partages sur ZFS le 27/12/2016

Bonjour

Suite à l’incident du 07 décembre, nous allons procéder à une maintenance de la baie de stockage ZFS qui fournit le service des Homes et des Partages pour les utilisateurs de Telecom-Paristech et de la DG de l’IMT.

Cette maintenance aura lieu mardi 27/12 à partir de 17h30 et devrait durer environ 4h

 

Cdt,

Laurent Rousset

2 Commentaires

  1. Bonsoir
    La maintenance de la baie zfs est terminée
    Les services Homes et Partages sont de nouveau accessibles aux utilisateurs

    Cdt
    Laurent Rousset

  2. Plus de détails sur la procédure qui a été déroulée le 27/12 au soir :

    17h30 : Oracle s’est connecté pour la mise en place du support
    – Les utilisateurs n’ont plus accès à leur Home ou Partage –

    17h54 : fin de la première étape de correction de la MTU pour une interface du ZFS-B232-1
    18h01 : Deuxième étape visant à reproduire l’incident du 07/12
    18h05 : reproduction du problème -> prise de traces (génération + récupération)
    18h57 : Seconde partie des prises de traces en mode NMI (Non Maskable Interrupt) -> panic on reboot (comportement normal pour éviter de tronquer les traces)
    19h00 : nouvelle étape de récupération de traces
    19h01 : Le ZFS-B232-2 à repris les services servant les Homes et Partages en mode dégradé (fonctionnent mais un peu lent)
    19h23 : ZFS-B232-1 rebooté -> sauvegarde d’un autre vmdump
    20h21 : création d’un support bundle pour le support Oracle
    création des bundles d’environ 100G -> 2h (fin 22h30)
    21h30 : redémarrage des serveurs DC2 et IDP2
    22h10 : services Homes et Partages à nouveau desservis pour les utilisateurs
    22h30 : envoi des support bundles à Oracle via ZFS/Maintenance -> à ce jour (28/12 16h : toujours en cours !)