Die Datei "crawler_surface_config.xml" enthält die folgenden XML-Abschnitte:
Enthält die Informationen zu den Objekten und Attributen, die die Crawler-Oberfläche für ein Objekt freigibt. Der <objects>-Abschnitt beschreibt das Layout einer Detailseite für jeden Objekttyp, der einem Crawler ausgesetzt wird. Dieser Abschnitt kontrolliert jedoch nicht die Auswahl von einzelnen Datensätzen. Der <objects>-Abschnitt ist eine Sammlung von Anmeldeinfos-Abschnitten.
Jedes Objekt wird in einem Anmeldeinfos-Abschnitt definiert. Die Standardangaben für diese Objekte lauten folgendermaßen:
Weist auf Knowledge-Dokumente hin.
Weist auf Changes hin.
Weist auf Issues hin.
Weist auf Incidents hin.
Weist auf Probleme hin
Weist auf Requests hin.
Hinweis: Weitere Informationen zu den Objektdefinition finden Sie im Technischen Referenzhandbuch.
Die XML-Datei enthält die folgenden Abschnitte, die den <head>-Abschnitt einer Detailseite in CA SDM erstellen:
Zeigt den Majic-Objektnamen des exponierten Objekts an.
Zeigt einen Platz für eine kurze Beschreibung des Objekts an. Dieses Element ist nur für Dokumentationszwecke gedacht und wird von der Crawler-Oberfläche ignoriert.
Zeigt den Attributnamen an, der das Datum und die Uhrzeit der letzten Änderung speichert. Dieser Zeitstempel wird dem Suchmaschinen-Crawler bereitgestellt, damit dieser feststellen kann, ob der Datensatz aktualisiert worden ist. Viele Crawler verwenden diesen Zeitstempel während eines inkrementellen Crawls. Ein aktualisierter Zeitstempel signalisiert, dass der Datensatz seit dem letzten Crawl geändert worden ist. Der Suchmaschinencrawler überspringt den Crawl, wenn der Datensatz seit dem letzten Crawl nicht aktualisiert worden ist.
Zeigt das Attribut an, das für den Titel der Detailseite verwendet wird. Die Suchmaschinen verwenden dieses Element als Titel des Dokuments, das in Suchergebnissen zurückgegeben wird. Dieser Elementeintrag generiert einen HTML-<title>-Tag im <head> der Detailseite. Bei Knowledge-Dokumenten wird als Titel standardmäßig der Titel des Knowledge-Dokuments verwendet. Die Zusammenfassung wird für den Titel bei Incidents, Problemen, Requests, Changes und Issues verwendet.
Zeigt einzelne oder mehrere Eigenschaften an, die als Metadaten exponiert werden. Metadaten ermöglichen einer Suchmaschine, zusätzliche Merkmale des Dokuments in seinem Index zu speichern. Metadaten werden nicht direkt durchsucht, sondern als Filter der Suchergebnisse angewandt. Dieser Abschnitt generiert HTML-<meta>-Tags im <head> der Detailseite.
Jeder Eintrag im <meta_data>-Abschnitt enthält einzelne oder mehrere <property>-Einträge. Jedes <property>-Element besteht aus einem <name>-Element und einem <content>-Element.
Gibt den Namen der Metadateneigenschaft an.
Gibt das Attribut des Objekts an, das als der Wert für die Metadaten verwendet wird.
Zusammen generiert jedes Elementpaar aus <name> und <content> einer <property> einen HTML-<meta>-Tag. Die Suchmaschinen-Crawler verwenden standardmäßig die folgenden beiden Metadateneigenschaften:
Zeigt die Metadateneigenschaft einer Suchmaschine an, die eine kurze Zusammenfassung des Dokuments speichert.
Gibt die Verfasser des Dokuments an.
Die CASDMTENANT-Metadateneigenschaft wird auch standardmäßig für jedes Objekt konfiguriert. Diese Eigenschaft ist eine für CA SDM spezifische Metadateneigenschaft. Wenn CA SDM für Mandantenfähigkeit konfiguriert wird, verwendet die Crawler-Oberfläche diese Eigenschaft, um den Mandanten-Namen des Objekts dem Crawler der Suchmaschine zu exponieren. Später, während einer Föderierten Suche, werden die von der Suchmaschine zurückgegebenen Ergebnisse auf Basis dieser Metadateneigenschaft gefiltert. Nur Ergebnisse, die entweder keine CASDMTENANT-Metadateneigenschaft haben, oder Ergebnisse, deren CASDMTENANT-Metadateneigenschaft mit dem Feld "Mandant" des Anwenders ihres Kontaktdatensatzes übereinstimmt, werden dem Anwender zurückgegeben. Wenn CA SDM für Mandantenfähigkeit konfiguriert wird, exponiert die Crawler-Oberfläche die CASDMTENANT-Metadateneigenschaft.
Die XML-Datei enthält die folgenden Abschnitte, die den <body>-Abschnitt einer Detailseite in CA SDM ausmachen:
Zeigt eine Liste von Attributen von dem Objekt an, das die Crawler-Oberfläche exponiert. Trennen Sie Mehrfachangaben mit einem Komma und einem Leerzeichen. Zum Beispiel, PROBLEM, LÖSUNG, SD_ASSET_ID.name.
Zeigt Informationen an, die der Crawler-Oberfläche von Aktivitätsprotokollen für Objekte exponiert werden, die über Aktivitätsprotokolle verfügen. Der <activity_logs>-Abschnitt enthält die Elemente Anmeldeinfos, <select_criteria>, <rel_attr> und <attributes>.
Gibt den Objektnamen an, der die Aktivitätsprotokolleinträge für das Objekt enthält. Zum Beispiel das Aktivitätsprotokollobjekt für:
Ermöglicht es Ihnen, die exponierten Aktivitätsprotokollobjekte zu filtern. Dieses Element ist wichtig, um die Relevanz Ihrer Suchergebnisse zu vergrößern, indem häufig auftretende Wörter eliminiert werden. Zum Beispiel enthält das <select_criteria> für chgalg die folgende magische WHERE-Klausel:
"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"
Dieses Kriterium schließt nur Aktivitätsprotokolleinträge ein, die es einem Anwender ermöglichen, Kommentare einzugeben, und eliminiert Aktivitätsprotokolleinträge mit festem Text wie "Anfänglich" oder "Dokument anhängen".
Gibt an, wie ein Aktivitätsprotokolleintrag sich auf sein übergeordnetes Objekt bezieht. Der <rel_attr>-Unterabschnitt enthält die Elemente <parent_obj_attr>- und <join_attr>.
Zeigt ein Attribut eines Aktivitätsprotokolls an, das einen SREL (oder Fremdschlüssel-Pointer) zum übergeordneten Objekt enthält. Zum Beispiel ist change_id das Attribut von chgalg.
Zeigt das relationale Attribut (Rel Attr) des übergeordneten Objekts an, das in <parent_obj_attr> gespeichert wird. Zum Beispiel ist das <join_attr> für chgalg "id". Sie können diese Werte anhand des folgenden Befehls verifizieren:
bop_sinfo -df chgalg
Sie können beide dieser Werte durch die Verwendung des Befehls "bop_sinfo -df chgalg" verifizieren. Die Ausgabe muss zeigen, dass der Wert für change_id SREL -> chg.id und für ISS SREL -> iss.persistent_id ist.
Dieser Unterabschnitt ermöglicht es Ihnen, dem Crawler der Suchmaschine Anhänge auszusetzen, sodass ihr Inhalt zusammen mit dem übergeordneten Objekt indiziert werden kann. Der <attachments>-Abschnitt ist nur für Objekte zugelassen, die über Anhänge verfügen.
Anhänge werden auf besondere Art und Weise von der Crawler-Oberfläche verarbeitet. Anstatt dem Crawler den Inhalt eines jeden Anhangs von der Crawler-Oberfläche zu senden, exponiert die Crawler-Oberfläche statt dessen einen Hyperlink, dem der Crawler folgen kann, um den Anhang von CA SDM herunterzuladen. Wird später während einer föderierten Suche auf den Hyperlink eines in den Suchergebnisse eingeschlossenen Anhangs geklickt, wird der Anwender zum übergeordneten Objekt anstelle direkt zum Anhang geleitet.
Der <attachments>-Abschnitt enthält die Elemente Anmeldeinfos, <rel_attr>, <attmnt_id> und <is_parent_updated>.
Dieses Element gibt das Majic-Objekt an, das den Anhang mit seinem übergeordneten Objekt verbindet.
Dieser Unterabschnitt funktioniert genauso wie bei den Aktivitätsprotokollen. Er gibt an, wie das übergeordnete Objekt sich auf dieses Objekt bezieht, das das übergeordnete Objekt mit dem Anhang verbindet.
Dieses Element gibt das Attribut dieses Verbindungsobjekts an, das auf den Anhang hinweist.
Dies ist ein besonderes Kennzeichen, das der Crawler-Oberfläche mitteilt, wie sie das Datum der letzten Änderung für das Objekt exponieren soll. Für einige Objekte wie Knowledge-Dokumente (KDs) wird bei Hinzufügen eines Anhangs das Datum der letzten Änderung des Knowledge-Dokuments nicht aktualisiert. Das Datum der letzten Änderung ist wichtig, wenn die Suchmaschine einen inkrementellen Crawl durchführt. Stellt der Crawler fest, dass ein Objekt seit seinem letzten Auffinden nicht aktualisiert worden ist, wird es üblicherweise übersprungen, und der Index wird durch Neuindexierung des Objekts nicht aktualisiert. Wenn Sie für <is_parent_updated> "No" angeben, überprüft die Crawler-Oberfläche das Datum der letzten Änderung aller Anhänge. Wird ein Datum gefunden, das jünger als das des übergeordneten Objekts ist, wird das jüngere Datum verwendet, wenn das übergeordnete Objekt exponiert wird. Dies führt üblicherweise dazu, dass die Suchmaschine das Objekt neu indiziert und dass die neuen Anhänge bei der Indexierung berücksichtigt werden.
Dieser Abschnitt wird für Objekte verwendet, die eine Liste von Konfigurationselementen enthalten. Dieser Abschnitt enthält die Elemente Anmeldeinfos, <rel_attr> und <attributes>.
Entspricht denen in Aktivitätsprotokollen und Anhängen.
Entspricht denen in Aktivitätsprotokollen und Anhängen.
Dieses Element entspricht dem in Anhängen.
Nach dem <objects>-Abschnitt kommt der <multi-farm_datasets>-Abschnitt. Während der <objects>-Abschnitt die CA SDM-Objekte und -Attribute definiert, die von der Crawler-Oberfläche exponiert werden können, gibt <multi-farm_datasets> an, welche Objekte exponiert und wie ihre Datensätze ausgewählt werden. Der <multi-farm_datasets>-Abschnitt ist eine Sammlung von <farm>-Abschnitten.
Jeder <farm>-Abschnitt kontrolliert die CA SDM-Informationen, die einem Crawler exponiert werden. Wird ein Crawler konfiguriert, wird der <farm>-Abschnitt in der URL angegeben. Nur die im <farm>-Abschnitt angegebenen Informationen werden dem Crawler exponiert. Jeder <farm>-Abschnitt enthält die Elemente <name>, <data_sets> und <sdm_user>.<name>
Dieses Element gibt den Namen des <farm>-Abschnitts an. Dieser Name wird in der URL angegeben, die zur Konfiguration des Crawlers verwendet wird. In diesem Feld wird zwischen Groß- und Kleinschreibung unterschieden.
Dieser Unterabschnitt gibt die Objekte an, die exponiert werden, und wie ihre Datensätze ausgewählt werden. Dieser Unterabschnitt enthält einzelne oder mehrere Anmeldeinfos-Elemente. Jedes Objektelement enthält ein <name>- und ein <select_criteria>-Element.
Dieses Element bezieht sich auf das Anmeldeinfos, das im <objects>-Abschnitt definiert wurde.
Dieses Element gibt eine Majic-WHERE-Klausel an, die verwendet wird, um die Datensätze des Objekts auszuwählen.
Dieses Element gibt die CA SDM-Anwender-ID an, die verwendet werden muss, wenn auf diese Farm zugegriffen wird. Diese Anwender-ID muss als Access Type=crawler und als Role=crawler haben.
|
Copyright © 2013 CA.
Alle Rechte vorbehalten.
|
|