前のトピック: Crawler Surface ユーザ ID の設定次のトピック: SharePoint クローラの設定


Crawler Surface XML 設定ファイル

crawler_surface_config.xml ファイルには、以下の XML セクションが含まれています。

<objects>

Crawler Surface がオブジェクトに関して公開するオブジェクトおよび属性に関する情報を指定します。 objects セクションでは、クローラに公開される各オブジェクト タイプの詳細ページのレイアウトについて説明します。 このセクションは、個別のレコードの選択内容を制御しません。 <objects> セクションは ログイン情報 セクションのコレクションです。

各オブジェクトは ログイン情報 セクションで定義されます。 これらのオブジェクトのデフォルト指定は次のように指定されます。

KD

ナレッジ ドキュメントを指定します。

chg

変更要求を指定します。

iss

案件を指定します。

in

インシデントを指定します。

pr

問題を指定します。

cr

リクエストを指定します。

XML ファイルには、CA SDM で詳細ページの <head> セクションを作成する以下のセクションが含まれます。

<name>

公開されるオブジェクトの Majic オブジェクト名を指定します。

<note>

オブジェクトの簡単な説明用の場所を指定します。 この要素はドキュメント目的のみです。Crawler Surface はこの要素を無視します。

<last_mod_dt>

最終変更日時を格納する属性名を指定します。 このタイムスタンプは検索エンジン クローラに公開されるので、検索エンジンはレコードが更新されたかどうかを判断できます。 多くのクローラは増分クロール中にこのタイムスタンプを使用します。 更新されたタイムスタンプにより、レコードが最後にクロールされた後にレコードが変更されたことがわかります。 レコードが最後のクロール以降更新されていない場合、検索エンジン クローラはクロールをスキップします。

<title>

詳細ページのタイトルに使用される属性を指定します。 検索エンジンは検索結果で返されるドキュメントのタイトルとしてこの要素を使用します。 この要素エントリは、詳細ページの <head> 内の HTML <title> タグを生成します。 ナレッジ ドキュメントについては、「Title」がナレッジ ドキュメントのデフォルトのタイトルになります。 概要は、インシデント、問題、リクエスト、変更要求、および案件のタイトルに使用されます。

<meta_data>

メタデータとして公開される 1 つ以上のプロパティを指定します。 メタデータは、検索エンジンがそのインデックスにドキュメントの追加の特性を格納することを可能にします。メタデータは直接検索されませんが、検索結果をフィルタするときに使用されます。 このセクションは、詳細ページの <head> 内の HTML <meta> タグを生成します。

<meta_data> セクション内のエントリにはそれぞれ 1 つ以上の <property> エントリが含まれます。 <property> 要素はそれぞれ <name> 要素および <content> 要素から構成されます。

<name>

メタデータ プロパティの名前を指定します。

<content>

メタデータの値として使用されるオブジェクトの属性を指定します。

<property> の <name> と <content> 要素の各ペアは、HTML <meta> タグを生成します。 検索エンジン クローラはデフォルトでは以下の 2 つのメタデータ プロパティを使用します。

説明

ドキュメントの短い概要を格納する検索エンジンのメタデータ プロパティを指定します。

作成者

ドキュメントの作成者を指定します。

CASDMTENANT メタデータ プロパティも各オブジェクトに対してデフォルトで設定されます。 このプロパティは CA SDM 固有のメタデータ プロパティです。 CA SDM がマルチテナンシーに対して設定されている場合、Crawler Surface は、検索エンジンのクローラにオブジェクトのテナント名を公開するためにこのプロパティを使用します。 後ほど、統合検索中に、検索エンジンから返された結果は、このメタデータ プロパティに基づいてフィルタされます。

XML ファイルには、CA SDM で詳細ページの <body> セクションを作成する以下のセクションが含まれます。

<additional_attributes_to_index>

Crawler Surface が公開するオブジェクトからの属性のリストを示します。 複数のエントリを入力する場合は、カンマおよびスペースで区切ります。 たとえば、「PROBLEM, RESOLUTION, SD_ASSET_ID.name」のように入力します。

<activity_logs>

アクティビティ ログがあるオブジェクトのアクティビティ ログからの Crawler Surface によって公開される情報を示します。 <activity_logs> セクションには ログイン情報、<select_criteria>、<rel_attr> および <attributes> の要素が含まれます。

ログイン情報

オブジェクトのアクティビティ ログ エントリが含まれるオブジェクト名を指定します。 たとえば、以下のアクティビティ ログ オブジェクトです。

  • インシデント、問題およびリクエストは alg です。
  • 変更要求は chgalg です。
  • 案件は issalg です。
  • ナレッジ ドキュメントは O_COMMENTS です。
<select_criteria>

公開されるアクティビティ ログ オブジェクトをフィルタすることを可能にします。 この要素は頻繁に発生する単語を減少させることによりユーザの検索結果の関連性を増加させるのに重要です。 たとえば、chgalg の <select_criteria> には以下の Magic Where 節が含まれます。

"type IN ('ST', 'UPD_RISK', 'CB', 'RS', 'LOG', 'TR', 'ESC' ,'NF', 'UPD_SCHED')"

この基準は、ユーザがコメントを入力することを可能にするアクティビティ ログ エントリのみを含み、初期またはドキュメントの添付のような固定テキストを持ったアクティビティ ログ エントリを除去します。

<rel_attr>

アクティビティ ログ エントリとその親オブジェクトを関連付ける方法を指定します。 <rel_attr> サブセクションには <parent_obj_attr> および <join_attr> 要素が含まれます。

<parent_obj_attr>

親オブジェクトに SREL (または外部キー ポインタ)が含まれるアクティビティ ログの属性を示します。 たとえば、change_id は chgalg の属性です。

<join_attr>

<parent_obj_attr> に格納される親オブジェクトの関連付け属性(Rel Attr)を示します。 たとえば、chgalg の <join_attr> は ID です。 以下のコマンドの使用によりこれらの値を確認できます。

bop_sinfo -df chgalg

bop_sinfo -df chgalg コマンドの使用によりこれらの値を両方とも確認できます。 その出力は、change_id の値が SREL -> chg.id で、ISS が SREL -> iss.persistent_id であることを示します。

<attachments>

このサブセクションは、親オブジェクトと共に添付ファイルのコンテンツのインデックスを作成できるように、検索エンジンのクローラに添付ファイルを公開することを可能にします。 <attachments> セクションは、添付ファイルがあるオブジェクトに対してのみ許可されます。

添付ファイルは Crawler Surface によって特別な方式で処理されます。 Crawler Surface からクローラに各添付ファイルのコンテンツを送信するのではなく、Crawler Surface はその代りに、CA SDM から添付ファイルをダウンロードするためにクローラが従うことができるハイパーリンクを公開します。 後ほど、統合検索中に、添付ファイルが検索結果に含まれている場合、ハイパーリンクをクリックすると、直接添付ファイルが表示されるのではなく、親オブジェクトがユーザに表示されます。

<attachments> セクションには ログイン情報、<rel_attr>、<attmnt_id>、および <is_parent_updated> 要素が含まれます。

ログイン情報

この要素は、添付ファイルをその親オブジェクトにリンクする Majic オブジェクトを指定します。

<rel_attr>

このサブセクションはアクティビティ ログでの動作と同じ動作をします。 親オブジェクトを添付ファイルにリンクするこのオブジェクトに親オブジェクトを関連付ける方法を指定します。

<attmnt_id>

この要素は、添付ファイルを指しているこのリンク オブジェクトの属性を指定します。

<is_parent_updated>

Crawler Surface に対してオブジェクトの最終変更日を公開する方法を指定します。 ナレッジ ドキュメント(KD)のような一部のオブジェクトに対して添付ファイルが追加される場合、ナレッジ ドキュメントの最終変更日は更新されません。 検索エンジンが増分クロールを実行している場合、最終変更日は重要です。

<configuration_items>

構成アイテムのリストが含まれるオブジェクトに使用されます。 このセクションには ログイン情報、<rel_attr>、および <attributes> 要素が含まれます。

ログイン情報

アクティビティ ログと添付ファイルでの動作と同じ動作をします。

<rel_attr>

アクティビティ ログと添付ファイルでの動作と同じ動作をします。

<attributes>

この要素は添付ファイルでの動作と同じ動作をします。

<multi-farm_datasets>

<objects> セクションの後に <multi-farm_datasets> セクションがあります。 <objects> セクションは Crawler Surface によって公開できる CA SDM オブジェクトおよび属性を定義しますが、<multi-farm_datasets> はレコードの選択方法を指定します。 <multi-farm_datasets> セクションは <farm> セクションのコレクションです。

<farm>

<farm> セクションはそれぞれ、クローラに公開される CA SDM 情報を制御します。 クローラが設定される場合、<farm> セクションは URL で指定されます。 <farm> セクションで指定された情報のみが、クローラに公開されます。 各 <farm> セクションには <name>、<data_sets>、および <sdm_user> 要素が含まれます。<name>

注: この値では、大文字と小文字が区別されます。

<data_sets>

公開されるオブジェクトおよびそれらのレコードの選択方法を指定します。 このサブセクションには 1 つ以上の ログイン情報 要素が含まれます。 オブジェクト要素にはそれぞれ <name> および <select_criteria> 要素が含まれます。

<name>

<objects> セクションで定義される ログイン情報 を参照します。

<select_criteria>

この要素は、オブジェクトのレコードを選択するために使用される Majic を指定します。

<sdm_user>

この要素は、このファームにアクセスするときに使用する必要がある CA SDM ユーザ ID を指定します。 ユーザ ID は、アクセス タイプと役割が「クローラ」である必要があります。

sdm_domsrvr_name

大量のインデックス データに対しては、Crawler Surface 用のオブジェクト マネージャを割り当てます。 デフォルトは、domsrvr です。

sharepoint_properties_file

この値は、デフォルトで以下の CA SDM ディレクトリにある SharePoint プロパティ ファイルの名前です。

NX_ROOT¥CATALINA_BASE_FS¥lib

CA SDM がマルチテナンシーに対して設定されている場合に統合検索と Crawler Surface の両方によって使用される設定パラメータが含まれます。

注: CA SDM がマルチテナンシーに対して設定されている場合、このファイル内の sharepoint_version パラメータを更新して、使用している SharePoint のバージョンを反映させてください。

<list_form_number_of_records_per_object>

このパラメータは、Crawler Surface がオブジェクトのリスト ページで示すハイパーリンクの数を設定するために使用します。

<send_wait_timeout>

この値は、Crawler Surface がオブジェクト マネージャからの応答を待つ時間(秒単位)を制御します。この時間が経過するとタイムアウトになります。