Argomento precedente: Errore del controller della grigliaArgomento successivo: Utilizzo dell'API di BFC


Errore della periferica di archiviazione
Introduzione

Per evitare la perdita di dati in caso di errore delle periferiche di archiviazione, CA AppLogic® controlla lo stato di tutti i dispositivi di archiviazione che supportano la tecnologia S.M.A.R.T. (o SMART, Self-Monitoring, Analysis, and Reporting Technology) . S.M.A.R.T. È un sistema di monitoraggio per dischi rigidi del computer in grado di rilevare e segnalare problemi sulla base di vari indicatori di affidabilità, nella speranza di anticipare eventuali errori.

Fondamentalmente gli errori delle periferiche di archiviazione rientrano in una delle seguenti due classi di base:

Errori prevedibili

Questi tipi di errore si verificano periodicamente. Rientrano in questa categoria l'usura meccanica e il danneggiamento graduale delle superfici di archiviazione. Una periferica di monitoraggio è in grado di rilevare questo tipo di problemi.

Errori imprevisti

Questi tipi di errore si verificano all'improvviso e senza preavviso. Rientrano in questa categoria componenti elettronici difettosi e guasti meccanici improvvisi. I guasti meccanici ammontano a circa il 60 percento di tutti gli errori delle unità. La maggior parte dei guasti meccanici sono il risultato di un'usura graduale. Ciononostante le loro conseguenze possono essere disastrose. In genere, tuttavia, prima che si verifichi un guasto totale è possibile cogliere vari segnali di errore imminente. Tali segnali possono essere, ad esempio, l'aumento del calore in uscita, l'aumento dei livelli di rumore, problemi di lettura e scrittura dei dati, l'aumento del numero di settori del disco rigido danneggiati e così via.

Livello di supporto

CA AppLogic® fornisce supporto per il monitoraggio dei seguenti tipi di dischi rigidi, se tali dischi supportano la tecnologia S.M.A.R.T. e rispondono correttamente a smartctl -i:

Note:

Come stabilire se il monitoraggio dello stato di archiviazione è supportato/abilitato dai server della griglia

Sul dashboard della griglia vengono riportati i seguenti avvisi, che indicano se il monitoraggio dello stato di archiviazione è abilitato e quali periferiche di archiviazione non vengono controllate da CA AppLogic® (server per server):

Inoltre, per determinare se il monitoraggio dello stato di archiviazione è supportato da un server specifico all'interno di una griglia, eseguire il seguente comando per il server:
3t srv info name --extended
e controllare la sezione dell'output --- Informazioni di verifica del disco ---. Se il server è in grado di monitorare almeno una periferica di archiviazione, il valore supportato è Sì; in caso contrario è No.

Come comportarsi quando su una griglia viene visualizzato l'avviso di dashboard Possibile errore del sistema di archiviazione

Questa sezione descrive quali azioni intraprendere quando sul dashboard della griglia viene registrato un errore del sistema di archiviazione.

I messaggi seguenti sono errori critici, che indicano un errore di archiviazione potenziale o immanente.

Se uno degli avvisi riportati sopra viene visualizzato sul dashboard della griglia, le azioni da intraprendere per salvare i dati dipendono dallo stato dei volumi che hanno degli stream sul server in errore:

I messaggi seguenti sono puramente informativi e non indicano necessariamente un errore del disco rigido. Si consiglia tuttavia di contattare il provider di servizi della griglia e richiedere assistenza nell'eseguire una diagnosi del problema rilevato.

Cancellazione del blocco di una griglia

Se si individua una griglia in stato bloccato, è possibile cancellare il blocco eseguendo un comando sul nodo di controllo.

Quando una griglia si trova in stato bloccato, la descrizione nell'icona di stato include le informazioni seguenti:

La griglia <gridname> è bloccata dal processo #13421

Attenersi alla seguente procedura:

  1. Accedere al nodo di controllo BFC come root.
  2. Eseguire il seguente comando:
    service bfc restart
    

    Il blocco è stato cancellato.