Rubrique précédente: Configurez l'ID d'utilisateur de l'interface du robot d'indexation.Rubrique suivante: Configuration du robot d'indexation SharePoint


Fichier de configuration XML de l'interface du robot d'indexation

Le fichier crawler_surface_config.xml comprend les sections suivantes.

<objects>

Spécifie les informations sur les objets et les attributs présentées dans l'interface du robot d'indexation pour un objet. La section d'objets décrit la disposition d'une page de détail pour chaque type d'objet présenté à un robot d'indexation. Cette section ne contrôle pas la sélection d'enregistrements spécifiques. La section <objects> regroupe un ensemble de sections informations de connexion.

Chaque objet est défini dans une section informations de connexion. Les spécifications par défaut de ces objets sont les suivantes :

KD

Spécifie des documents de connaissances.

chg

Spécifie des demandes de changement.

iss

Spécifie des demandes client.

in

Spécifie des incidents.

pr

Spécifie des problèmes.

cr

Spécifie des demandes.

Le fichier XML contient les sections suivantes qui forment la section <head> d'une page de détail dans CA SDM :

<name>

Indique le nom d'objet Majic de l'objet présenté.

<note>

Indique un emplacement pour saisir une brève description de l'objet. Cet élément est uniquement utilisé dans la documentation. L'interface d'un robot d'indexation ignore cet élément.

<last_mod_dt>

Indique le nom de l'attribut qui stocke la date et l'heure du dernier changement. Cet horodatage est présenté au robot d'indexation du moteur de recherche pour permettre à celui-ci de déterminer si l'enregistrement a été mis à jour. De nombreux robots d'indexation utilisent cet horodatage lors d'une indexation incrémentielle. Un horodatage mis à jour signale que l'enregistrement a été modifié après sa dernière indexation. Le robot d'indexation de moteur de recherche ignore l'indexation si l'enregistrement n'est pas mis à jour depuis la dernière indexation.

<title>

Indique l'attribut utilisé pour le titre de la page de détail. Les moteurs de recherche utilisent cet élément comme titre du document qui est renvoyé dans des résultats de la recherche. Cette entrée d'élément génère une balise <title> HTML dans l'en-tête (<head>) de la page de détail. Dans le cas du document de connaissances, le titre est défini par défaut sur la mosaïque du document de connaissances. Le récapitulatif est utilisé pour le titre des incidents, des problèmes, des demandes, des demandes de changement et des demandes client.

<meta_data>

Indique une ou plusieurs propriétés présentées comme métadonnées. Les métadonnées permettent à un moteur de recherche de stocker d'autres caractéristiques du document dans son index. Les métadonnées ne font pas directement l'objet de recherche, mais sont en revanche utilisées pour filtrer des résultats de recherche. Cette section génère des balises <meta> HTML dans l'en-tête (<head>) de la page de détail.

Chaque entrée dans la section <meta_data> contient une ou plusieurs entrées <property>. Chaque élément <property> comporte un élément <name> et un élément <content>.

<name>

Indique le nom de la propriété de métadonnées.

<content>

Indique l'attribut de l'objet qui sera utilisé comme valeur pour les métadonnées.

Ensemble, chaque paire d'éléments <name> et <content> d'un élément <property> génère une balise <meta> HTML. Par défaut, les robots d'indexation de moteur de recherche utilisent les deux propriétés de métadonnées suivantes :

Description

Indique la propriété de métadonnées d'un moteur de recherche qui stocke un bref récapitulatif du document.

Auteur

Indique l'auteur du document.

La propriété de métadonnées CASDMTENANT est également configurée par défaut pour chaque objet. Cette propriété de métadonnées est spécifique à CA SDM. Si CA SDM est configuré pour l'hébergement multiclient, l'interface du robot d'indexation utilise cette propriété pour présenter le nom des clients hébergés de l'objet au robot d'indexation du moteur de recherche. Ultérieurement, pendant une recherche fédérée, les résultats renvoyés par le moteur de recherche sont filtrés d'après cette propriété de métadonnées.

Le fichier XML contient les sections suivantes qui forment la section <body> d'une page de détail dans CA SDM :

<additional_attributes_to_index>

Indique une liste d'attributs de l'objet présenté par l'interface du robot d'indexation. Séparez plusieurs entrées à l'aide d'une virgule suivie d'un espace. Par exemple : PROBLEM, RESOLUTION, SD_ASSET_ID.name.

<activity_logs>

Indique des informations présentées par l'interface du robot d'indexation issues de journaux d'activité pour les objets qui en disposent. La section <activity_logs> contient les éléments informations de connexion, <select_criteria>, <rel_attr> et <attributes>.

informations de connexion

Spécifie le nom de l'objet qui contient les entrées du journal d'activité pour l'objet. Exemple d'objet de journal d'activité :

  • Pour les incidents, problèmes et demandes : alg
  • Pour les demandes de changement : chgalg
  • Pour les demandes client : issalg
  • Pour les documents de connaissances : O_COMMENTS
<select_criteria>

Permet de filtrer les objets de journal d'activité présentés. Cet élément est nécessaire à l'amélioration de la pertinence des résultats de recherche, en diminuant le nombre de mots fréquemment générés. Par exemple, <select_criteria> pour chgalg contient la clause Where Majic suivante :

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

Ce critère inclut uniquement des entrées de journal d'activité qui autorisent un utilisateur à saisir des commentaires et à supprimer des entrées de journal d'activité contenant du texte fixe tel que Initial ou Joindre un document.

<rel_attr>

Spécifie la relation d'une entrée de journal d'activité avec son objet parent. La sous-section <rel_attr> contient des éléments <parent_obj_attr> et <join_attr>.

<parent_obj_attr>

Indique un attribut d'un journal d'activité qui contient un SREL (ou pointeur de clé étrangère) vers l'objet parent. Par exemple, change_id est l'attribut de chgalg.

<join_attr>

Indique l'attribut relationnel (Rel Attr) de l'objet parent qui est stocké dans <parent_obj_attr>. Exemple : <join_attr> de chgalg est ID. Vous pouvez vérifier ces valeurs à l'aide de la commande suivante :

bop_sinfo -df chgalg

Vous pouvez vérifier ces deux valeurs à l'aide de la commande bop_sinfo -df chgalg. La sortie doit indiquer que la valeur pour change_id est SREL -> chg.id et la valeur pour ISS est SREL -> iss.persistent_id.

<attachments>

Cette sous-section permet de présenter des pièces jointes au robot d'indexation du moteur de recherche, de sorte à indexer leur contenu avec l'objet parent. La section <attachments> est uniquement autorisée pour des objets contenant des pièces jointes.

Les pièces jointes sont gérées de manière spéciale par l'interface du robot d'indexation. Au lieu d'envoyer le contenu de chaque pièce jointe au robot d'indexation à partir de l'interface du robot d'indexation, celle-ci présente un lien hypertexte que le robot d'indexation peut suivre pour télécharger la pièce jointe à partir de CA SDM. Lors d'une recherche fédérée ultérieure, si une pièce jointe est incluse dans les résultats de recherche, un lien hypertexte dirigera l'utilisateur vers l'objet parent et non directement vers la pièce jointe.

La section <attachments> contient les éléments informations de connexion, <rel_attr>, <attmnt_id> et <is_parent_updated>.

informations de connexion

Cet élément spécifie l'objet Majic qui lie la pièce jointe à son objet parent.

<rel_attr>

Cette sous-section fonctionne de la même manière qu'avec les journaux d'activité. Elle spécifie la relation de l'objet parent à l'objet qui lie l'objet parent à la pièce jointe.

<attmnt_id>

Cet élément spécifie l'attribut de l'objet de liaison qui pointe vers la pièce jointe.

<is_parent_updated>

Spécifie à l'interface de robot d'indexation le mode de présentation de la date du dernier changement pour l'objet. Pour certains objets (tels que les documents de connaissances), la date du dernier changement du document de connaissances n'est pas mise à jour lorsqu'une pièce jointe est ajoutée. La date du dernier changement est importante lorsque le moteur de recherche exécute une indexation incrémentielle.

<configuration_items>

Cette section est utilisée pour des objets qui contiennent une liste d'éléments de configuration. Cette section contient les éléments informations de connexion, <rel_attr> et <attributes>.

informations de connexion

Cet élément fonctionne de la même manière qu'avec les journaux d'activité et les pièces jointes.

<rel_attr>

Cet élément fonctionne de la même manière qu'avec les journaux d'activité et les pièces jointes.

<attributes>

Cet élément fonctionne de la même manière qu'avec les pièces jointes.

<multi-farm_datasets>

La section <objects> est suivie de la section <multi-farm_datasets>. Tandis que la section <objects> définit les objets et les attributs CA SDM qui peuvent être présentés par l'interface du robot d'indexation, <multi-farm_datasets> spécifie les objets présentés et le mode de sélection de leurs enregistrements. La section <multi-farm_datasets> regroupe un ensemble de sections <farm>.

<farm>

Chaque section <farm> contrôle les informations CA SDM présentées à un robot d'indexation. Lorsqu'un robot d'indexation est configuré, la section <farm> est spécifiée dans l'URL. Seules les informations spécifiées dans la section <farm> sont présentées au robot d'indexation. Chaque section <farm> contient les éléments <name>, <data_sets> et <sdm_user>.

Remarque : Cette valeur respecte la casse.

<data_sets>

Spécifiez les objets présentés et le mode de sélection de leurs enregistrements. Cette sous-section contient un ou plusieurs éléments informations de connexion. Chaque élément d'objet contient un élément <name> et un élément <select_criteria>.

<name>

Fait référence à l'élément informations de connexion défini dans la section <objects>.

<select_criteria>

Spécifie un élément Majic utilisé pour sélectionner les enregistrements de l'objet.

<sdm_user>

Cet élément spécifie l'ID d'utilisateur de CA SDM qui doit être utilisé lors de l'accès à cette batterie. Cet ID d'utilisateur doit disposer d'un accès de type crawler et d'un rôle crawler (robot d'indexation).

sdm_domsrvr_name

En cas de grand volume de données d'indexation, dédiez un gestionnaire d'objets pour l'interface du robot d'indexation. La valeur par défaut est domsrvr.

sharepoint_properties_file

Cette valeur est le nom du fichier de propriétés de SharePoint disponible par défaut dans le répertoire CA SDM :

NX_ROOT\CATALINA_BASE_FS\lib

Contient un paramètre de configuration utilisé par la recherche fédérée et l''interface du robot d'indexation lorsque CA SDM est configuré pour l'hébergement multiclient.

Remarque : Si CA SDM est configuré pour l'hébergement multiclient, mettez à jour le paramètre sharepoint_version dans ce fichier pour refléter votre version de SharePoint.

<list_form_number_of_records_per_object>

Utilisez ce paramètre pour configurer le nombre de liens hypertextes présentés par l'interface du robot d'indexation dans une page de liste pour un objet.

<send_wait_timeout>

Cette valeur contrôle la durée d'attente (en secondes) d'une réponse avant l'expiration du gestionnaire d'objets par l'interface du robot d'indexation.