Cette rubrique couvre divers types d'échecs de contrôleur de grille, qui nécessitent une intervention manuelle de la part l'administrateur de grille pour rétablir le fonctionnement du contrôleur de grille.
Remarque : Il est vivement recommandé de lire la référence de haute disponibilité de CA AppLogic® pour se familiariser avec les fonctionnalités de haute disponibilité de CA AppLogic®, en particulier en ce qui concerne la haute disponibilité du contrôleur de grille et les types d'échec susceptibles de se produire.
CA AppLogic® se remet automatiquement de deux types d'échecs de contrôleur de grille :
Dans certains cas d'échec, le contrôleur de grille peut devenir inaccessible et ne peut pas être automatiquement récupéré par CA AppLogic®. Ces cas observés par l'utilisateur sont résumés ci-dessous :
Un administrateur peut afficher les informations d'état de l'interface utilisateur graphique de récupération dont la maintenance est assurée par CA AppLogic®. Ces informations sont stockées dans un fichier qui se trouve dans dom0 sur le serveur de contrôleur (le serveur sur lequel le contrôleur de grille va être démarré). Pour plus d'informations sur l'emplacement et le format du fichier d'état de l'interface utilisateur graphique de récupération, reportez-vous à la dernière rubrique au bas de ce document.
Une liste des raisons pour lesquelles le contrôleur de grille est susceptible de ne pas redémarrer seul est disponible ci-dessous :
Pour rétablir le fonctionnement du contrôleur de grille, procédez comme suit :
La page Grilles s'affiche. L'état de la grille peut être En cours d'exécution, Arrêté, En panne, En panne - En cours d'exécution (la grille n'a pas pu être créée, mais les serveurs restent en cours d'exécution), Exécution en cours, mais intervention de l'utilisateur requise et Redémarrage requis.
La boîte de dialogue Modifier les paramètres de grille s'ouvre.
primary=srvaddr
La valeur srvaddr correspond à l'ID de serveur (srvNN) ou adresse du serveur qui va devenir le nouveau contrôleur. Les adresses doivent être accessibles sur la dorsale locale. Si un nom est spécifié, il se doit résoudre en une adresse accessible sur la dorsale.
Lorsque ce paramètre est utilisé sur une grille opérationnelle (avec un contrôleur en cours d'exécution), le contrôleur est immédiatement arrêté et redémarré sur le nouvel hôte. Normalement, cela n'affecte pas les applications sur la grille, mais peut perturber l'accès de l'interface utilisateur graphique au contrôleur de grille et différer ou interrompre les commandes de gestion des applications qui sont en cours.
Il est également recommandé de disposer d'au moins deux serveurs secondaires dans la grille, en plus du serveur principal. Si la grille n'a pas de serveurs secondaires ou si les serveurs secondaires ne sont pas opérationnels et ne peuvent pas être rétablis, procédez comme suit pour configurer au moins deux serveurs secondaires pour la grille. S'il n'y a pas suffisamment de serveurs disponibles, il est recommandé d'ajouter davantage de serveurs à la grille pour la haute disponibilité de contrôleur de grille haute.
secondary=srvaddr,srvaddr,...
Les valeurs srvaddr correspondent aux ID de serveur ou adresses des serveurs qui sont autorisés de reprendre le rôle de l'hôte de contrôleur en cas d'échec de l'hôte de contrôleur principal. Vous pouvez utiliser ce paramètre pour limiter ou modifier l'affectation automatique des hôtes de contrôleur secondaires. Vous pouvez spécifier jusqu'à 7 hôtes secondaires. Vous pouvez spécifier ce paramètre de manière distincte ou avec le paramètre primary=, pour simultanément réaffecter les hôtes secondaires et déplacer le contrôleur vers un nouvel hôte principal. Le paramètre secondary= n'a aucun effet sur une grille désactivée. Pour réaffecter des hôtes de contrôleur secondaires, commencez par récupérer la grille à l'aide du paramètre de grille primary=srvaddr.
Si vous ne parvenez pas à restaurer le contrôleur de grille à l'aide des procédures susmentionnées, il s'agit d'un problème irrécupérable dont la résolution nécessite une intervention manuelle ; contactez immédiatement le support technique de CA. Collectez les informations suivantes à l'attention du support technique de CA :
Un administrateur peut afficher les informations d'état de l'interface utilisateur graphique de récupération dont la maintenance est assurée par CA AppLogic®. Ces informations sont stockées dans un fichier qui se trouve dans dom0 sur le serveur de contrôleur (le serveur sur lequel le contrôleur de grille va être démarré). Ce fichier est nommé /usr/local/recovery/gui/chroot/data/status et contient le statut actuel de la récupération du contrôleur de grille. Les informations stockées dans ce fichier sont utilisées par l'interface utilisateur graphique de récupération pour afficher la progression/l'état. Ce fichier utilise le format suivant, codé en JSON (exemple de données ci-dessous) :
{
"grid_name" : "my-grid-name",
"grid_version" : "2.7.6",
"role" : "Recovery controller 2",
"status" : "Recovery in progress (master recovery controller is srv2)",
"recovery_start_time" : "15:14:41 PDT (21 mars 09)",
"recovery_eta" : "15:23:54 PDT",
"recovery_remaining_time" : 278,
"current_time" : "15:19:12 PDT",
"stage" : 0,
"stage_remaining_time" : 79,
"failure_reason" : "srv1 down (no response for 30 sec on either network)",
"known_servers" : "srv1:down,srv2:up",
"stages" : [
"Waiting for quorum (at least 3 of the N servers to connect)",
"Waiting for server with controller volumes to become available",
"Waiting for remaining controller volume streams",
"Verifying both networks are present",
"Sharing controller volumes",
"Mounting controller volumes",
"Starting grid controller",
"Grid controller started"
],
"msgs" : [
{
"time" : "15:15:23 PDT",
"severity" : "alert",
"text" : "My alert message"
},
{
"time" : "15:16:00 PDT",
"severity" : "info",
"text" : "My info message"
}
]
}
Quelques remarques sur les champs ci-dessus :
Lorsqu'une récupération de contrôleur de grille n'est pas en cours, seuls quelques champs sont disponibles dans le fichier d'état :
{
"grid_name" : "my-grid-name",
"grid_version" : "2.7.6",
"role" : "Recovery controller 2",
"status" : "Okay",
"known_servers" : "srv2:up,srv1:up"
}
|
Copyright © 2013 CA.
Tous droits réservés.
|
|