Argomento precedente: Configurazione dell'ID utente della superficie crawlerArgomento successivo: Configurazione del crawler SharePoint


File di configurazione XML della superficie crawler

Il file crawler_surface_config.xml contiene le seguenti sezioni XML.

<objects>

Specifica le informazioni sugli oggetti e sugli attributi visualizzati dalla superficie crawler per un oggetto. La sezione oggetti descrive il layout di una pagina dei dettagli per ciascun tipo di oggetto che viene visualizzato a un crawler. Questa sezione non controlla la selezione dei singoli record. La sezione <objects> è una raccolta di sezioni informazioni di accesso.

Ciascun oggetto è definito in una sezione informazioni di accesso. Le specifiche predefinite fornite per questi oggetti sono:

DC

Specifica i documenti della conoscenza.

chg

Specifica gli Ordini di cambiamento.

iss

Specifica le Issue.

in

Specifica gli Incidenti.

pr

Specifica i Problemi.

cr

Specifica le Richieste.

Il file XML contiene le sezioni seguenti che creano la sezione <head> di una pagina dei dettagli in CA SDM:

<name>

Specifica il nome oggetto Majic dell'oggetto visualizzato.

<note>

Specifica lo spazio in cui inserire una breve descrizione dell'oggetto. Questo elemento esiste solo ai fini della documentazione e viene ignorato dalla superficie crawler.

<last_mod_dt>

Specifica il nome dell'attributo che archivia la data e l'ora dell'ultima modifica. Data e ora vengono visualizzate al crawler del motore di ricerca per consentire al motore di ricerca di determinare se il record è stato aggiornato. Molti crawler utilizzano data e ora durante una ricerca per indicizzazione incrementale. Data e ora aggiornate segnala che il record è stato cambiato dopo l'ultima ricerca per indicizzazione nel record. Il crawler del motore di ricerca ignora la ricerca per indicizzazione se il record non è stato aggiornato dall'ultima ricerca per indicizzazione.

<title>

Specifica l'attributo utilizzato per il titolo della pagina dei dettagli. I motori di ricerca utilizzano questo elemento come titolo del documento che viene restituito nei risultati della ricerca. Questa voce genera un tag di <title> HTML in <head> della pagina dei dettagli. Per il documento della conoscenza, l'impostazione predefinita per il titolo è il titolo del documento della conoscenza. Il riepilogo viene utilizzato per il titolo di Incidenti, Problemi, Richieste, Ordini di cambiamento e Issue.

<meta_data>

Specifica una o più proprietà che vengono visualizzate come metadati. I metadati consentono a un motore di ricerca di archiviare caratteristiche extra del documento nel rispettivo indice. I metadati non sono oggetto di una ricerca diretta, vengono invece utilizzati per filtrare i risultati della ricerca. Questa sezione genera tag <meta> HTML in <head> della pagina dei dettagli.

Ciascuna voce nella sezione <meta_data> contiene una o più voci di <property>. Ciascun elemento di <property> è formato da un elemento <name> e un elemento <content>.

<name>

Specifica il nome della proprietà dei metadati.

<content>

Specifica l'attributo dell'oggetto che verrà utilizzato come valore per i metadati.

Insieme ciascuna coppia di elementi <name> e <content> di una <property> generano un tag <meta> HTML. I crawler del motore di ricerca utilizzano per impostazione predefinita le due proprietà dei metadati seguenti:

Descrizione

Specifica la proprietà dei metadati di un motore di ricerca che archivia un breve riepilogo del documento.

Autore

Specifica l'autore del documento.

La proprietà dei metadati CASDMTENANT viene configurata anche per impostazione predefinita per ciascun oggetto. Si tratta di una proprietà dei metadati specifica di CA SDM. Quando CA SDM viene configurato per la multi-tenancy, la superficie crawler utilizza questa proprietà per visualizzare il nome del titolare dell'oggetto al crawler del motore di ricerca. Più tardi, durante una ricerca federata, i risultati restituiti dal motore di ricerca vengono filtrati in base a questa proprietà dei metadati.

Il file XML contiene le sezioni seguenti che creano la sezione <body> di una pagina dei dettagli in CA SDM:

<additional_attributes_to_index>

Indica un elenco degli attributi dall'oggetto visualizzato dalla superficie crawler. Voci multiple separate con una virgola e uno spazio. Ad esempio, PROBLEM, RESOLUTION, SD_ASSET_ID.name.

<activity_logs>

Indica le informazioni visualizzate dalla superficie crawler dai registri attività per gli oggetti dotati di registri attività. La sezione <activity_logs> contiene gli elementi informazioni di accesso, <select_criteria>, <rel_attr> e <attributes>.

informazioni di accesso

Specifica il nome oggetto che contiene le voci del registro attività per l'oggetto. Ad esempio, l'oggetto del registro attività per:

  • Incidenti, Problemi e Richieste: alg.
  • Ordini di cambiamento: chgalg.
  • Issue: issalg.
  • Documenti della conoscenza: O_COMMENTS.
<select_criteria>

Consente di filtrare gli oggetti del registro attività visualizzati. Questo elemento è importante per aumentare la rilevanza dei risultati della ricerca diminuendo le parole che si presentano di frequente. Ad esempio, <select_criteria> per chgalg contiene la clausola Where Majic seguente:

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

Questo criteri includono solo voci del registro attività che consentono a un utente di immettere commenti ed elimina le voci del registro attività con testo fisso come Iniziale o Allega documento.

<rel_attr>

Specifica la relazione di una voce del registro attività con il relativo oggetto padre. La sottosezione <rel_attr> contiene elementi di <parent_obj_attr> e <join_attr>.

<parent_obj_attr>

Indica un attributo di un registro attività che contiene un SREL (o un puntatore di chiavi esterne) all'oggetto padre. Ad esempio, change_id è l'attributo di chgalg.

<join_attr>

Indica l'attributo relazionale (Rel Attr) dell'oggetto padre archiviato in <parent_obj_attr>. Ad esempio, il <join_attr> per chgalg è l'ID. È possibile verificare questi valori mediante il comando seguente:

bop_sinfo -df chgalg

È possibile verificare entrambi i valori mediante il comando bop_sinfo -df chgalg. L'output deve mostrare che il valore per change_id è SREL -> chg.id e che ISS è SREL -> iss.persistent_id.

<attachments>

Questa sottosezione consente di visualizzare agli allegati al crawler del motore di ricerca in modo che il loro contenuto possa essere indicizzato insieme all'oggetto padre. La sezione <attachments> è consentita solo per gli oggetti che dispongono di allegati.

Gli allegati vengono gestiti in modo speciale dalla superficie crawler. Anziché inviare il contenuto di ciascun allegato al crawler dalla superficie crawler, la superficie crawler visualizza un collegamento ipertestuale che il crawler può seguire per scaricare l'allegato da CA SDM. Se durante una ricerca federata successiva un allegato viene incluso nei risultati della ricerca, facendo clic sul collegamento ipertestuale l'utente accede all'oggetto padre anziché visualizzare direttamente all'allegato.

La sezione <attachments> contiene gli elementi informazioni di accesso, <rel_attr>, <attmnt_id> e <is_parent_updated>.

informazioni di accesso

Questo elemento specifica l'oggetto Majic che collega l'allegato al rispettivo oggetto padre.

<rel_attr>

Questa sottosezione funziona come nei registri attività. Specifica il modo in cui l'oggetto padre è correlato all'oggetto che collega l'oggetto padre all'allegato.

<attmnt_id>

Questo elemento specifica l'attributo dell'oggetto di collegamento che punta all'allegato.

<is_parent_updated>

Specifica alla superficie crawler il modo in cui visualizzare la data di ultima modifica per l'oggetto. Per alcuni oggetti, come i documenti della conoscenza (Knowledge Document, KD), quando viene aggiunto un allegato, la data dell'ultima modifica del documento della conoscenza non viene aggiornata. La data dell'ultima modifica è importante quando il motore di ricerca sta eseguendo una ricerca per indicizzazione incrementale.

<configuration_items>

Viene utilizzata per gli oggetti che contengono un elenco di elementi della configurazione. Questa sezione contiene gli elementi informazioni di accesso, <rel_attr> e <attributes>.

informazioni di accesso

Funzionano come nei registri attività e negli allegati.

<rel_attr>

Funzionano come nei registri attività e negli allegati.

<attributes>

Questo elemento funziona come negli allegati.

<multi-farm_datasets>

Dopo la sezione <objects> si trova la sezione <multi-farm_datasets>. Mentre la sezione <objects> definisce gli oggetti di CA SDM e gli attributi visualizzabili con la superficie crawler, <multi-farm_datasets> specifica il modo in cui i record vengono selezionati. La sezione <multi-farm_datasets> è una raccolta di sezioni <farm>.

<farm>

Ciascuna sezione <farm> controlla le informazioni di CA SDM che vengono visualizzate a un crawler. Quando un crawler viene configurato, la sezione <farm> viene specificata nell'URL. Solo le informazioni specificate nella sezione <farm> vengono visualizzate al crawler. Ciascuna sezione <farm> contiene gli elementi <name>, <data_sets> e <sdm_user>.<name>.

Nota: Questo valore rispetta la distinzione tra maiuscole e minuscole.

<data_sets>

Specificare gli oggetti visualizzati e il modo in cui vengono selezionati i record. Questa sottosezione contiene uno o più elementi informazioni di accesso. Ciascun elemento dell'oggetto contiene un elemento <name> e <select_criteria>.

<name>

Fa riferimento a informazioni di accesso definito nella sezione <objects>.

<select_criteria>

Questo elemento specifica un criterio Majic utilizzato per selezionare i record dell'oggetto.

<sdm_user>

Questo elemento specifica l'ID utente di CA SDM da utilizzare per l'accesso alla farm. L'ID utente deve presentare il tipo di accesso crawler e un ruolo crawler.

sdm_domsrvr_name

Per un'elevata quantità di dati di indicizzazione, dedicare una gestione oggetto per la superficie crawler. Il valore predefinito è domsrvr.

sharepoint_properties_file

Questo valore corrisponde al nome del file di proprietà di SharePoint disponibile Per impostazione predefinita nella directory di CA SDM:

NX_ROOT\CATALINA_BASE_FS\lib

Contiene il parametro di configurazione utilizzato dalla ricerca federata e dalla superficie crawler in caso di configurazione multi-tenancy di CA SDM.

Nota: In caso di configurazione multi-tenancy di CA SDM, aggiornare il parametro sharepoint_version in questo file in modo che rifletta la versione di SharePoint in uso.

<list_form_number_of_records_per_object>

Utilizzare questo parametro per configurare il numero di collegamenti ipertestuali presentati dalla superficie crawler in una pagina di elenco per un oggetto.

<send_wait_timeout>

Questo valore riguarda il numero di secondi attesi dalla superficie crawler per una risposta dalla gestione oggetto prima del timeout.