Argomento precedente: Recupero del controller di griglia

Argomento successivo: Guida di manutenzione avanzata


Monitoraggio dello stato di archiviazione
Panoramica

Per evitare la perdita di dati in caso di errore delle periferiche di archiviazione, CA AppLogic controlla lo stato di tutti i dispositivi di archiviazione che supportano la tecnologia S.M.A.R.T. (o SMART, Self-Monitoring, Analysis, and Reporting Technology) . S.M.A.R.T. È un sistema di monitoraggio per dischi rigidi del computer in grado di rilevare e segnalare problemi sulla base di vari indicatori di affidabilità, nella speranza di anticipare eventuali errori.

Fondamentalmente gli errori delle periferiche di archiviazione rientrano in una delle seguenti due classi di base:

Errori prevedibili

Questi tipi di errore si verificano periodicamente. Rientrano in questa categoria l'usura meccanica e il danneggiamento graduale delle superfici di archiviazione. Una periferica di monitoraggio è in grado di rilevare questo tipo di problemi.

Errori imprevisti

Questi tipi di errore si verificano all'improvviso e senza preavviso. Rientrano in questa categoria componenti elettronici difettosi e guasti meccanici improvvisi. I guasti meccanici ammontano a circa il 60 percento di tutti gli errori delle unità. La maggior parte dei guasti meccanici sono il risultato di un'usura graduale. Ciononostante le loro conseguenze possono essere disastrose. In genere, tuttavia, prima che si verifichi un guasto totale è possibile cogliere vari segnali di errore imminente. Tali segnali possono essere, ad esempio, l'aumento del calore in uscita, l'aumento dei livelli di rumore, problemi di lettura e scrittura dei dati, l'aumento del numero di settori del disco rigido danneggiati e così via.

Livello di supporto

CA AppLogic fornisce supporto per il monitoraggio dei seguenti tipi di dischi rigidi, se tali dischi supportano la tecnologia S.M.A.R.T. e rispondono correttamente a smartctl -i:

Note:

Come stabilire se il monitoraggio dello stato di archiviazione è supportato/abilitato dai server della griglia

Sul dashboard della griglia vengono riportati i seguenti avvisi, che indicano se il monitoraggio dello stato di archiviazione è abilitato e quali periferiche di archiviazione non vengono controllate da CA AppLogic (server per server):

Inoltre, per determinare se il monitoraggio dello stato di archiviazione è supportato da un server specifico all'interno di una griglia, eseguire il seguente comando per il server:
3t srv info name --extended
e controllare la sezione dell'output --- Informazioni di verifica del disco ---. Se il server è in grado di monitorare almeno una periferica di archiviazione, il valore supportato è Sì; in caso contrario è No.

Come comportarsi quando su una griglia viene visualizzato l'avviso di dashboard Possibile errore del sistema di archiviazione

Questa sezione descrive quali azioni intraprendere quando sul dashboard della griglia viene registrato un errore del sistema di archiviazione.

I messaggi seguenti sono errori critici, che indicano un errore di archiviazione potenziale o immanente.

Se uno degli avvisi riportati sopra viene visualizzato sul dashboard della griglia, le azioni da intraprendere per salvare i dati dipendono dallo stato dei volumi che hanno degli stream sul server in errore:

I messaggi seguenti sono puramente informativi e non indicano necessariamente un errore del disco rigido. Si consiglia tuttavia di contattare il provider di servizi della griglia e richiedere assistenza nell'eseguire una diagnosi del problema rilevato.