Rubrique précédente: Configurez l'ID de l'utilisateur du robot d'indexation de surface.Rubrique suivante: Configuration du robot d'indexation SharePoint


Fichier de configuration XML du robot d'indexation de surface

Le fichier crawler_surface_config.xml comprend les sections XML suivantes.

<objects>

Spécifie les renseignements sur les objets et les attributs que l'interface du robot d'indexation de surface affichera pour un objet. Cette section décrit la structure de la page de détail pour chaque type d'objet que voit un robot d'indexation. Cette section n'exerce aucun contrôle sur la sélection des enregistrements spécifiques. La section <objects> regroupe plusieurs sections <object>.

Chaque des objets doit être défini dans une section <object>. Les spécifications par défaut pour ces objets sont les suivantes :

KD

Indique les documents de connaissances.

chg

Modifie les demandes de changement.

iss

Correspond à Difficultés.

in

Correspond à Incidents.

pr

Correspond à Problèmes.

cr

Correspond à Requêtes.

Le fichier XML contient les sections suivantes qui, ensemble, constituent la section <head> d'une page de détail dans CA SDM :

<name>

Indique le nom d'objet Majic de l'objet affiché.

<note>

Indique l'emplacement d'une description courte de l'objet. Cet élément n'est présenté qu'à des fins de documentation et sera ignorée par l'interface du robot d'indexation.

<last_mod_dt>

Indique le nom de l'attribut qui enregistre la date et l'heure de la dernière modification. Le robot d'indexation du moteur de recherche pourra voir l'horodatage, ce qui lui permettra de déterminer si l'enregistrement a été mis à jour. Plusieurs robots d'indexation utilisent cet horodatage lors d'une analyse incrémentielle. Un horodatage mis à jour indique que l'enregistrement a été modifié depuis la dernière analyse. Le robot d'indexation du moteur de recherche saute l'analyse si l'enregistrement n'a pas été mis à jour depuis la dernière analyse.

<title>

Indique l'attribut utilisé pour le titre de la page de détail. Le moteur de recherche utilise cet élément comme titre du document renvoyé dan les résultats de recherche. L'entrée de cet élément génère une balise <title> HTML dans la section <head> de la page de détail. En ce qui concerne le document de connaissances, le titre utilise par défaut le titre du document de connaissances. Le résumé est utilisé pour les titres des incidents, des problèmes, des demandes, des demandes de changements et des demandes client.

<meta_data>

Indique une ou plusieurs propriétés affichées comme des métadonnées. Les métadonnées permettent à un moteur de recherche d'enregistrer des caractéristiques supplémentaires du document dans son index. Les métadonnées ne font pas l'objet d'une recherche directe, mais sont plutôt utilisées pour filtrer les résultats. La section génère des balises HTML <meta> dans la section <head> de la page de détail.

Chaque entrée dans la section <meta_data> contient une ou plusieurs entrées <property>. Chaque élément <property> se compose d'un élément <name> et d'un élément <content>.

<name>

Indique le nom des propriétés des métadonnées.

<content>

Indique l'attribut de l'objet qui sera utilisé comme valeur pour les métadonnées.

Ensemble, les éléments <name> et <content> de la <property> se combinent pour générer une balise HTML <meta>. Les robots d'indexation du moteur de recherche utilisent par défaut deux propriétés des métadonnées :

Description

Indique la propriété des métadonnées d'un moteur de recherche qui enregistre un bref résumé du document.

Auteur

Indique l'auteur du document.

Les propriétés des métadonnées CASDMTENANT sont également configurées par défaut pour chacun des objets. Ces propriétés sont spécifiques aux métadonnées CA SDM. Lorsque CA SDM est configuré pour l'hébergement multiclient, le robot d'indexation de surface utilise cette propriété pour afficher le nom du client hébergé de l'objet qui peut ainsi être vu par le robot d'indexation du moteur de recherche. Puis, lors d'une recherche fédérée, les résultats du moteur de recherche seront ensuite filtrés en fonction des propriétés des métadonnées.

Le fichier XML contient les sections suivantes qui créent la section <body> d'une page de détail dans CA SDM :

<additional_attributes_to_index>

Indique une liste des attributs de l'objet qu'affiche le robot d'indexation de surface. Utilisez des espaces et des virgules pour séparer les entrées multiples. Par exemple, PROBLEM, RESOLUTION, SD_ASSET_ID.name.

<activity_logs>

Indique l'information tirée des journaux d'activité qu'affiche le robot d'indexation de surface pour les objets qui utilisent de tels journaux. La section <activity_logs> contient les éléments <object>, <select_criteria>, <rel_attr> et <attributes>.

<object>

Spécifie le nom de l'objet qui contient les entrées du journal d'activité pour cet objet. Par exemple, l'objet du journal d'activité pour :

  • les incidents, les problèmes et les demandes est alg.
  • Celui pour les demandes de changement est chgalg.
  • Celui pour les demandes client est issalg.
  • Alors que celui pour les documents de connaissances est O_COMMENTS.
<select_criteria>

Vous permet de filtrer les objets du journal d'activité qui sont affichés. Cet élément est important pour augmenter la pertinence des résultats de vos recherches en diminuant le nombre de mots utilisés fréquemment. Par exemple, <select_criteria> pour chgalg contient la clause Magic Where suivante :

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

Le critère inclut seulement les entrées du journal d'activité qui autorisent un utilisateur à entrer des commentaires et élimine les entrées du journal d'activité possédant un texte fixe comme Initial ou Joindre un document.

<rel_attr>

Spécifie le lien entre une entrée du journal d'activité et son objet parent. La sous-section <rel_attr> contient les éléments <parent_obj_attr> et <join_attr>.

<parent_obj_attr>

Indique un attribut du journal d'activité qui contient un SREL (ou un pointeur de clé étranger) pour l'objet parent. Par exemple, change_id est l'attribut de chgalg.

<join_attr>

Indique l'attribut relationnel (Rel Attr) de l'objet parent stocké dans <parent_obj_attr>. Par exemple, id est l'attribut <join_attr> de chgalg. Vous pouvez vérifier ces valeurs à l'aide de la commande suivante :

bop_sinfo -df chgalg

Vous pouvez vérifier ces deux valeurs avec la commande bop_sinfo -df chgalg. La sortie doit indiquer SREL -> chg.id comme valeur pour change_id et SREL -> iss.persistent_id pour ISS.

<attachments>

Cette sous-section vous permet d'afficher les pièces jointes au robot d'indexation du moteur de recherche pour que leur contenu soit indexé conjointement avec l'objet parent. Cette section n'est permise pour les objets ayant des pièces jointes.

Les pièces jointes sont traitées différemment par l'interface du robot d'indexation de surface. Plutôt que d'envoyer le contenu de chaque pièce jointe au robot d'indexation de surface, ce denier affiche plutôt un lien hypertexte que peut suivre le robot pour télécharger la pièce jointe de CA SDM. Si, lors d'une recherche fédérée ultérieure, une pièce jointe est incluse dans les résultats de la recherche, le fait de cliquer sur le lien hypertexte enverra l'utilisateur à l'objet parent plutôt que directement à la pièce jointe.

La section <attachments> contient les éléments <object>, <rel_attr>, <attmnt_id> et <is_parent_updated>.

<object>

Cet élément spécifie l'objet Majic qui lie la pièce jointe à son objet parent.

<rel_attr>

Cette sous-section fonctionne de la même façon que dans les journaux d'activité. Elle spécifie le lien qui existe entre l'objet parent et cet objet qui relie l'objet parent à la pièce jointe.

<attmnt_id>

Cet élément spécifie l'attribut de l'objet de liaison qui pointe vers la pièce jointe.

<is_parent_updated>

Indique au robot d'indexation de surface comment afficher la date de dernière modification pour l'objet. Pour certains objets, comme les documents des connaissances, la date de dernière modification n'est pas mise à jour lorsqu'une pièce jointe est ajoutée. La date de dernière modification est importante lorsque le moteur de recherche effectue une analyse incrémentielle.

<configuration_items>

Cette section est utilisée pour les objets qui contiennent une liste d'éléments de configuration. Elle contient les éléments <object>, <rel_attr> et <attributes>.

<object>

Fonctionne de la même façon que dans les journaux d'activité et les pièces jointes.

<rel_attr>

Fonctionne de la même façon que dans les journaux d'activité et les pièces jointes.

<attributes>

Cet élément fonctionne de la même façon que dans les pièces jointes.

<multi-farm_datasets>

La section <multi-farm_datasets> suit la section <objects>. Alors que la section <objects> définit les objets et les attributs CA SDM que peut afficher le robot d'indexation de surface, la section <multi-farm_datasets> spécifie comment sont sélectionnés leurs enregistrements. La section <multi-farm_datasets> regroupe plusieurs sections <farm>.

<farm>

Chaque section <farm> contrôle l'information CA SDM que peut voir un robot d'indexation. Lorsqu'un robot d'indexation est configuré, la section <farm> est spécifiée dans l'URL. Le robot d'indexation ne pourra voir que l'information spécifiée dans la section <farm>. Chaque section <farm> contient les éléments <name>, <data_sets> et <sdm_user>.

Remarque : Cette valeur est sensible à la casse.

<data_sets>

Indique les objets affichés et la manière dont leurs enregistrements sont sélectionnés. Cette sous-section contient un ou plusieurs éléments <object>. Chaque objet contient un élément <name> et un élément <select_criteria>.

<name>

Fait référence à la valeur <object> définie à la section <objects>.

<select_criteria>

Cet élément spécifie une clause Majic qui est utilisée pour sélectionner les enregistrements de l'objet.

<sdm_user>

Cet élément spécifie l'ID d'utilisateur CA SDM qui doit être utilisé pour accéder à cette batterie. Cet ID doit avoir les attributs suivants, soit Access Type=crawler et Role=crawler.

sdm_domsrvr_name

Si les volumes d'indexation de données sont importants, dédiez un gestionnaire d'objets au robot d'indexation de surface. La valeur par défaut est domsrvr.

sharepoint_properties_file

Cette valeur est le nom du fichier de propriétés SharePoint qui est disponible par défaut dans le répertoire CA SDM suivant :

NX_ROOT\CATALINA_BASE_FS\lib

Contient le paramètre de configuration qui est utilisé tant pour la recherche fédérée que pour le robot d'indexation de surface lors de la configuration de CA SDM pour l'hébergement multiclient.

Remarque : Si CA SDM est configuré pour l'hébergement multiclient, mettez à jour le paramètre sharepoint_version dans ce fichier en fonction de votre version de SharePoint.

<list_form_number_of_records_per_object>

Utilisez ce paramètre pour configurer le nombre de liens hypertexte que le robot d'indexation de surface présente sur une page de liste pour un objet.

<send_wait_timeout>

Cette valeur contrôle le temps (en secondes) pendant lequel le robot d'indexation de surface doit attendre une réponse du gestionnaire d'objets avant d'abandonner l'opération.