Vorheriges Thema: Konfigurieren der Anwender-ID für die Crawler-OberflächeNächstes Thema: Konfigurieren des SharePoint-Crawlers


Crawler-Oberflächen-XML-Konfigurationsdatei

Die Datei "crawler_surface_config.xml" enthält die folgenden XML-Abschnitte:

<objects>

Enthält die Informationen zu den Objekten und Attributen, die die Crawler-Oberfläche für ein Objekt freigibt. Der <objects>-Abschnitt beschreibt das Layout einer Detailseite für jeden Objekttyp, der einem Crawler ausgesetzt wird. Dieser Abschnitt kontrolliert jedoch nicht die Auswahl von einzelnen Datensätzen. Der <objects>-Abschnitt ist eine Sammlung von Anmeldeinfos-Abschnitten.

Jedes Objekt wird in einem Anmeldeinfos-Abschnitt definiert. Die Standardangaben für diese Objekte lauten folgendermaßen:

KD

Gibt Knowledge-Dokumente an.

chg

Gibt Changes an.

Iss

Gibt Issues an.

in

Gibt Incidents an.

pr

Gibt Probleme an.

cr

Gibt Requests an.

Die XML-Datei enthält die folgenden Abschnitte, die den <head>-Abschnitt einer Detailseite in CA SDM erstellen:

<name>

Geben Sie den Majic-Objektnamen des angezeigten Objekts an.

<note>

Geben Sie eine kurze Beschreibung des Objekts an. Dieses Element ist nur für Dokumentationszwecke gedacht und wird von der Crawler-Oberfläche ignoriert.

<last_mod_dt>

Geben Sie den Attributnamen an, der das Datum und die Uhrzeit der letzten Änderung speichert. Dieser Zeitstempel wird dem Suchmaschinen-Crawler bereitgestellt, damit dieser feststellen kann, ob der Datensatz aktualisiert worden ist. Viele Crawler verwenden diesen Zeitstempel während eines inkrementellen Crawls. Ein aktualisierter Zeitstempel signalisiert, dass der Datensatz seit dem letzten Crawl geändert worden ist. Der Suchmaschinencrawler überspringt den Crawl, wenn der Datensatz seit dem letzten Crawl nicht aktualisiert worden ist.

<title>

Geben Sie das Attribut an, das für den Titel der Detailseite verwendet wird. Die Suchmaschinen verwenden dieses Element als Titel des Dokuments, das in Suchergebnissen zurückgegeben wird. Dieser Elementeintrag generiert einen HTML-<title>-Tag im <head> der Detailseite. Bei Knowledge-Dokumenten wird als Titel standardmäßig der Titel des Knowledge-Dokuments verwendet. Die Zusammenfassung wird für den Titel bei Incidents, Problemen, Requests, Changes und Issues verwendet.

<meta_data>

Geben Sie einzelne oder mehrere Eigenschaften an, die als Metadaten angezeigt werden. Metadaten ermöglichen einer Suchmaschine, zusätzliche Merkmale des Dokuments in seinem Index zu speichern. Metadaten werden nicht direkt durchsucht, sondern als Filter der Suchergebnisse angewandt. Dieser Abschnitt generiert HTML-<meta>-Tags im <head> der Detailseite.

Jeder Eintrag im <meta_data>-Abschnitt enthält einzelne oder mehrere <property>-Einträge. Jedes <property>-Element besteht aus einem <name>-Element und einem <content>-Element.

<name>

Geben Sie den Namen der Metadateneigenschaft an.

<content>

Geben Sie das Attribut des Objekts an, das als Wert für die Metadaten verwendet wird.

Zusammen generiert jedes Elementpaar aus <name> und <content> einer <property> einen HTML-<meta>-Tag. Die Suchmaschinen-Crawler verwenden standardmäßig die folgenden beiden Metadateneigenschaften:

Beschreibung

Geben Sie die Metadateneigenschaft einer Suchmaschine an, die eine kurze Zusammenfassung des Dokuments speichert.

Author

Geben Sie den Verfasser des Dokuments an.

Die CASDMTENANT-Metadateneigenschaft wird auch standardmäßig für jedes Objekt konfiguriert. Diese Eigenschaft ist eine für CA SDM spezifische Metadateneigenschaft. Wenn CA SDM für Mandantenfähigkeit konfiguriert wird, verwendet die Crawler-Oberfläche diese Eigenschaft, um den Mandanten-Namen des Objekts dem Crawler der Suchmaschine zu exponieren. Später, während einer Föderierten Suche, werden die von der Suchmaschine zurückgegebenen Ergebnisse auf Basis dieser Metadateneigenschaft gefiltert.

Die XML-Datei enthält die folgenden Abschnitte, die den <body>-Abschnitt einer Detailseite in CA SDM ausmachen:

<additional_attributes_to_index>

Zeigt eine Liste von Attributen von dem Objekt an, das die Crawler-Oberfläche exponiert. Trennen Sie Mehrfachangaben mit einem Komma und einem Leerzeichen. Zum Beispiel, PROBLEM, LÖSUNG, SD_ASSET_ID.name.

<activity_logs>

Zeigt Informationen an, die der Crawler-Oberfläche von Aktivitätsprotokollen für Objekte exponiert werden, die über Aktivitätsprotokolle verfügen. Der <activity_logs>-Abschnitt enthält die Elemente Anmeldeinfos, <select_criteria>, <rel_attr> und <attributes>.

Anmeldeinfos

Gibt den Objektnamen an, der die Aktivitätsprotokolleinträge für das Objekt enthält. Zum Beispiel das Aktivitätsprotokollobjekt für:

  • Incidents, Probleme und Requests ist alg.
  • Changes ist chgalg.
  • Issues ist issalg.
  • Knowledge-Dokumente ist O_COMMENTS.
<select_criteria>

Ermöglicht es Ihnen, die exponierten Aktivitätsprotokollobjekte zu filtern. Dieses Element ist wichtig, um die Relevanz Ihrer Suchergebnisse zu vergrößern, indem häufig auftretende Wörter eliminiert werden. Zum Beispiel enthält das <select_criteria> für chgalg die folgende magische WHERE-Klausel:

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

Dieses Kriterium schließt nur Aktivitätsprotokolleinträge ein, die es einem Anwender ermöglichen, Kommentare einzugeben, und eliminiert Aktivitätsprotokolleinträge mit festem Text wie "Anfänglich" oder "Dokument anhängen".

<rel_attr>

Gibt an, wie ein Aktivitätsprotokolleintrag sich auf sein übergeordnetes Objekt bezieht. Der <rel_attr>-Unterabschnitt enthält die Elemente <parent_obj_attr>- und <join_attr>.

<parent_obj_attr>

Zeigt ein Attribut eines Aktivitätsprotokolls an, das einen SREL (oder Fremdschlüssel-Pointer) zum übergeordneten Objekt enthält. Zum Beispiel ist change_id das Attribut von chgalg.

<join_attr>

Zeigt das relationale Attribut (Rel Attr) des übergeordneten Objekts an, das in <parent_obj_attr> gespeichert wird. Zum Beispiel ist das <join_attr> für chgalg "id". Sie können diese Werte anhand des folgenden Befehls verifizieren:

bop_sinfo -df chgalg

Sie können beide dieser Werte durch die Verwendung des Befehls "bop_sinfo -df chgalg" verifizieren. Die Ausgabe muss zeigen, dass der Wert für change_id SREL -> chg.id und für ISS SREL -> iss.persistent_id ist.

<attachments>

Dieser Unterabschnitt ermöglicht es Ihnen, dem Crawler der Suchmaschine Anhänge auszusetzen, sodass ihr Inhalt zusammen mit dem übergeordneten Objekt indiziert werden kann. Der <attachments>-Abschnitt ist nur für Objekte zugelassen, die über Anhänge verfügen.

Anhänge werden auf besondere Art und Weise von der Crawler-Oberfläche verarbeitet. Anstatt dem Crawler den Inhalt eines jeden Anhangs von der Crawler-Oberfläche zu senden, exponiert die Crawler-Oberfläche statt dessen einen Hyperlink, dem der Crawler folgen kann, um den Anhang von CA SDM herunterzuladen. Wird später während einer föderierten Suche auf den Hyperlink eines in den Suchergebnisse eingeschlossenen Anhangs geklickt, wird der Anwender zum übergeordneten Objekt anstelle direkt zum Anhang geleitet.

Der <attachments>-Abschnitt enthält die Elemente Anmeldeinfos, <rel_attr>, <attmnt_id> und <is_parent_updated>.

Anmeldeinfos

Dieses Element gibt das Majic-Objekt an, das den Anhang mit seinem übergeordneten Objekt verbindet.

<rel_attr>

Dieser Unterabschnitt funktioniert genauso wie bei den Aktivitätsprotokollen. Er gibt an, wie das übergeordnete Objekt sich auf dieses Objekt bezieht, das das übergeordnete Objekt mit dem Anhang verbindet.

<attmnt_id>

Dieses Element gibt das Attribut dieses Verbindungsobjekts an, das auf den Anhang hinweist.

<is_parent_updated>

Gibt der Crawler-Oberfläche an, wie das Datum der letzten Änderung für das Objekt angezeigt werden soll. Für einige Objekte wie Knowledge-Dokumente (KDs) wird bei Hinzufügen eines Anhangs das Datum der letzten Änderung des Knowledge-Dokuments nicht aktualisiert. Das Datum der letzten Änderung ist wichtig, wenn die Suchmaschine einen inkrementellen Crawl durchführt.

<configuration_items>

Dieser Abschnitt wird für Objekte verwendet, die eine Liste der Configuration Items enthalten. Dieser Abschnitt enthält die Elemente Anmeldeinfos, <rel_attr> und <attributes>.

Anmeldeinfos

Entspricht denen in Aktivitätsprotokollen und Anhängen.

<rel_attr>

Entspricht denen in Aktivitätsprotokollen und Anhängen.

<attributes>

Dieses Element entspricht dem in Anhängen.

<multi-farm_datasets>

Nach dem <objects>-Abschnitt kommt der <multi-farm_datasets>-Abschnitt. Während der <objects>-Abschnitt die CA SDM-Objekte und -Attribute definiert, die von der Crawler-Oberfläche angezeigt werden können, gibt <multi-farm_datasets> an, wie Datensätze ausgewählt werden. Der <multi-farm_datasets>-Abschnitt ist eine Sammlung von <farm>-Abschnitten.

<farm>

Jeder <farm>-Abschnitt kontrolliert die CA SDM-Informationen, die einem Crawler exponiert werden. Wird ein Crawler konfiguriert, wird der <farm>-Abschnitt in der URL angegeben. Nur die im <farm>-Abschnitt angegebenen Informationen werden dem Crawler exponiert. Jeder <farm>-Abschnitt enthält die Elemente <name>, <data_sets>, <sdm_user> und <name>.

Hinweis: Dieser Wert beachtet Groß- und Kleinschreibung.

<data_sets>

Geben Sie die angezeigten Objekte an, und geben Sie an, wie ihre Datensätze ausgewählt werden. Dieser Unterabschnitt enthält einzelne oder mehrere Anmeldeinfos-Elemente. Jedes Objektelement enthält ein <name>- und ein <select_criteria>-Element.

<name>

Verweist das Anmeldeinfos, das im <objects>-Abschnitt definiert ist.

<select_criteria>

Dieses Element gibt eine Majic an, die verwendet wird, um die Datensätze des Objekts auszuwählen.

<sdm_user>

Dieses Element gibt die CA SDM-Anwender-ID an, die verwendet werden muss, wenn auf diese Farm zugegriffen wird. Diese Anwender-ID muss Zugriffstyp=crawler und Rolle=crawler haben.

sdm_domsrvr_name

Bei einer großen Menge an Indizierungsdaten sollten Sie einen Objektmanager für die Crawler-Oberfläche zuordnen. Standard ist domsrvr.

sharepoint_properties_file

Dieser Wert ist der Name der SharePoint-Eigenschaftsdatei, die standardmäßig im CA SDM-Verzeichnis verfügbar ist:

NX_ROOT\CATALINA_BASE_FS\lib

Enthält einen Konfigurationsparameter, der sowohl von der föderierten Suche als auch von der Crawler-Oberfläche verwendet wird, wenn CA SDM für mehrere Mandanten konfiguriert ist.

Hinweis: Wenn CA SDM für mehrere Mandanten konfiguriert ist, aktualisieren Sie den Parameter "sharepoint_version" in dieser Datei, um Ihre SharePoint-Version anzugeben.

<list_form_number_of_records_per_object>

Verwenden Sie diesen Parameter für die Konfiguration der Anzahl von Hyperlinks, die die Crawler-Oberfläche auf einer Listenseite für ein Objekt angibt.

<send_wait_timeout>

Dieser Wert steuert die Anzahl der Sekunden, die die Crawler-Oberfläche auf eine Antwort vom Objektmanager wartet, bevor das Zeitlimit überschritten wird.