前のトピック: wsptbl オブジェクト次のトピック: テーブルとオブジェクトの相互参照


Crawler Surface XML 設定ファイル

crawler_surface_config.xml ファイルには、以下の XML セクションが含まれています。

<objects>

Crawler Surface がオブジェクトに関して公開するオブジェクトおよび属性に関する情報を指定します。 objects セクションでは、クローラに公開される各オブジェクト タイプの詳細ページのレイアウトについて説明します。 このセクションは、個別のレコードの選択内容を制御しません。 <objects> セクションは ログイン情報 セクションのコレクションです。

各オブジェクトは ログイン情報 セクションで定義されます。 これらのオブジェクトのデフォルト指定は次のように指定されます。

KD

ナレッジ ドキュメントを示します。

chg

変更要求を示します。

iss

案件を示します。

in

インシデントを示します。

pr

問題を示します。

cr

リクエストを示します。

注: オブジェクトの定義の詳細については、「テクニカル リファレンス ガイド」を参照してください。

XML ファイルには、CA SDM で詳細ページの <head> セクションを作成する以下のセクションが含まれます。

<name>

公開されるオブジェクトの Majic オブジェクト名を示します。

<note>

オブジェクトの簡単な説明用の場所を示します。 この要素はドキュメント目的のみです。Crawler Surface はこの要素を無視します。

<last_mod_dt>

最終変更日時を格納する属性名を示します。 このタイムスタンプは検索エンジン クローラに公開されるので、検索エンジンはレコードが更新されたかどうかを判断できます。 多くのクローラは増分クロール中にこのタイムスタンプを使用します。 更新されたタイムスタンプにより、レコードが最後にクロールされた後にレコードが変更されたことがわかります。 レコードが最後のクロール以降更新されていない場合、検索エンジン クローラはクロールをスキップします。

<title>

詳細ページのタイトルに使用される属性を示します。 検索エンジンは検索結果で返されるドキュメントのタイトルとしてこの要素を使用します。 この要素エントリは、詳細ページの <head> 内の HTML <title> タグを生成します。 ナレッジ ドキュメントについては、タイトルは、デフォルトで「Title of the Knowledge Document」になります。 概要は、インシデント、問題、リクエスト、変更要求、および案件のタイトルに使用されます。

<meta_data>

メタデータとして公開される 1 つ以上のプロパティを示します。 メタデータは、検索エンジンがそのインデックスにドキュメントの追加の特性を格納することを可能にします。メタデータは直接検索されませんが、検索結果をフィルタするときに使用されます。 このセクションは、詳細ページの <head> 内の HTML <meta> タグを生成します。

<meta_data> セクション内のエントリにはそれぞれ 1 つ以上の <property> エントリが含まれます。 <property> 要素はそれぞれ <name> 要素および <content> 要素から構成されます。

<name>

メタデータ プロパティの名前を示します。

<content>

メタデータの値として使用されるオブジェクトの属性を示します。

<property> の <name> と <content> 要素の各ペアは、HTML <meta> タグを生成します。 検索エンジン クローラはデフォルトでは以下の 2 つのメタデータ プロパティを使用します。

説明

ドキュメントの短い概要を格納する検索エンジンのメタデータ プロパティを示します。

作成者

ドキュメントの作成者を示します。

CASDMTENANT メタデータ プロパティも各オブジェクトに対してデフォルトで設定されます。 このプロパティは CA SDM 固有のメタデータ プロパティです。 CA SDM がマルチテナンシーに対して設定されている場合、Crawler Surface は、検索エンジンのクローラにオブジェクトのテナント名を公開するためにこのプロパティを使用します。 後ほど、統合検索中に、検索エンジンから返された結果は、このメタデータ プロパティに基づいてフィルタされます。 どちらにも CASDMTENANT メタデータ プロパティがない結果のみ、または CASDMTENANT メタデータ プロパティがそれらの連絡先レコードのユーザのテナント フィールドに一致する結果のみがユーザに返されます。 CA SDM がマルチテナンシーに対して設定されている場合、Crawler Surface は CASDMTENANT メタデータ プロパティを公開します。

XML ファイルには、CA SDM で詳細ページの <body> セクションを作成する以下のセクションが含まれます。

<additional_attributes_to_index>

Crawler Surface が公開するオブジェクトからの属性のリストを示します。 複数のエントリを入力する場合は、カンマおよびスペースで区切ります。 たとえば、「PROBLEM, RESOLUTION, SD_ASSET_ID.name」のように入力します。

<activity_logs>

アクティビティ ログがあるオブジェクトのアクティビティ ログからの Crawler Surface によって公開される情報を示します。 <activity_logs> セクションには ログイン情報、<select_criteria>、<rel_attr> および <attributes> の要素が含まれます。

ログイン情報

オブジェクトのアクティビティ ログ エントリが含まれるオブジェクト名を指定します。 たとえば、以下のアクティビティ ログ オブジェクトです。

  • インシデント、問題およびリクエストは alg です。
  • 変更要求は chgalg です。
  • 案件は issalg です。
  • ナレッジ ドキュメントは O_COMMENTS です。
<select_criteria>

公開されるアクティビティ ログ オブジェクトをフィルタすることを可能にします。 この要素は頻繁に発生する単語を減少させることによりユーザの検索結果の関連性を増加させるのに重要です。 たとえば、chgalg の <select_criteria> には以下の Magic Where 節が含まれます。

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

この基準は、ユーザがコメントを入力することを可能にするアクティビティ ログ エントリのみを含み、初期またはドキュメントの添付のような固定テキストを持ったアクティビティ ログ エントリを除去します。

<rel_attr>

アクティビティ ログ エントリとその親オブジェクトを関連付ける方法を指定します。 <rel_attr> サブセクションには <parent_obj_attr> および <join_attr> 要素が含まれます。

<parent_obj_attr>

親オブジェクトに SREL (または外部キー ポインタ)が含まれるアクティビティ ログの属性を示します。 たとえば、change_id は chgalg の属性です。

<join_attr>

<parent_obj_attr> に格納される親オブジェクトの関連付け属性(Rel Attr)を示します。 たとえば、chgalg の <join_attr> は ID です。 以下のコマンドの使用によりこれらの値を確認できます。

bop_sinfo -df chgalg

bop_sinfo -df chgalg コマンドの使用によりこれらの値を両方とも確認できます。 その出力は、change_id の値が SREL -> chg.id で、ISS が SREL -> iss.persistent_id であることを示します。

<attachments>

このサブセクションは、親オブジェクトと共に添付ファイルのコンテンツのインデックスを作成できるように、検索エンジンのクローラに添付ファイルを公開することを可能にします。 <attachments> セクションは、添付ファイルがあるオブジェクトに対してのみ許可されます。

添付ファイルは Crawler Surface によって特別な方式で処理されます。 Crawler Surface からクローラに各添付ファイルのコンテンツを送信するのではなく、Crawler Surface はその代りに、CA SDM から添付ファイルをダウンロードするためにクローラが従うことができるハイパーリンクを公開します。 後ほど、統合検索中に、添付ファイルが検索結果に含まれている場合、ハイパーリンクをクリックすると、直接添付ファイルが表示されるのではなく、親オブジェクトがユーザに表示されます。

<attachments> セクションには ログイン情報、<rel_attr>、<attmnt_id>、および <is_parent_updated> 要素が含まれます。

ログイン情報

この要素は、添付ファイルをその親オブジェクトにリンクする Majic オブジェクトを指定します。

<rel_attr>

このサブセクションはアクティビティ ログでの動作と同じ動作をします。 親オブジェクトを添付ファイルにリンクするこのオブジェクトに親オブジェクトを関連付ける方法を指定します。

<attmnt_id>

この要素は、添付ファイルを指しているこのリンク オブジェクトの属性を指定します。

<is_parent_updated>

これは、オブジェクトの最終変更日を公開する方法を Crawler Surface に伝える特別なフラグです。 ナレッジ ドキュメント(KD)のようないくつかのオブジェクトに対して、添付ファイルが追加される場合、ナレッジ ドキュメントの最終変更日は更新されません。 検索エンジンが増分クロールを実行している場合、最終変更日は重要です。 通常、最後にオブジェクトに遭遇して以来そのオブジェクトが更新されていないとクローラが認識すると、クローラはそれをスキップし、オブジェクトのインデックスを再作成してインデックスを更新する処理を行いません。 <is_parent_updated> に No を指定すると、Crawler Surface はすべての添付ファイルの最終変更日を確認します。 親オブジェクトよりも後の日付が見つかった場合、親オブジェクトを公開するときにその後の日付を使用します。 これにより、通常、検索エンジンはオブジェクトのインデックスを再作成し、インデックス作成中に新しい添付ファイルを追加します。

<configuration_items>

このセクションは、構成アイテムのリストが含まれるオブジェクトに使用されます。 このセクションには ログイン情報、<rel_attr>、および <attributes> 要素が含まれます。

ログイン情報

アクティビティ ログと添付ファイルでの動作と同じ動作をします。

<rel_attr>

アクティビティ ログと添付ファイルでの動作と同じ動作をします。

<attributes>

この要素は添付ファイルでの動作と同じ動作をします。

<multi-farm_datasets>

<objects> セクションの後に <multi-farm_datasets> セクションがあります。 <objects> セクションは Crawler Surface によって公開できる CA SDM オブジェクトおよび属性を定義しますが、<multi-farm_datasets> は、公開するオブジェクトおよびそれらのレコードの選択方法を指定します。 <multi-farm_datasets> セクションは <farm> セクションのコレクションです。

<farm>

<farm> セクションはそれぞれ、クローラに公開される CA SDM 情報を制御します。 クローラが設定される場合、<farm> セクションは URL で指定されます。 <farm> セクションで指定された情報のみが、クローラに公開されます。 各 <farm> セクションには <name>、<data_sets> および <sdm_user> 要素が含まれます。<name>

この要素は、<farm> セクションの名前を指定します。 この名前は、クローラを設定するために使用される URL で指定されます。 この値は、大文字と小文字が区別されます。

<data_sets>

このサブセクションは、公開するオブジェクトおよびそれらのレコードの選択方法を指定します。 このサブセクションには 1 つ以上の ログイン情報 要素が含まれます。 オブジェクト要素にはそれぞれ <name> および <select_criteria> 要素が含まれます。

<name>

この要素は、<objects> セクションで定義された ログイン情報 を参照します。

<select_criteria>

この要素は、オブジェクトのレコードを選択するために使用される Majic where 節を指定します。

<sdm_user>

この要素は、このファームにアクセスするときに使用する必要がある CA SDM ユーザ ID を指定します。 このユーザ ID には Access Type=crawler および Role=crawler が必要です。