パーサ設定の定義

ナレッジマネジメントの管理 › ナレッジドキュメントの制御 › 検索 › KT 検索エンジン › ナレッジマネジメント検索の利用 › パーサ設定 › パーサ設定の定義

パーサ設定の定義

ナレッジベースに発行されたドキュメントは解析され、タイトル、概要、問題、解決策の各フィールドを基にキーワードが作成されます。ユーザがナレッジベースを検索すると、ユーザクエリのキーワードとナレッジベースから解析されたキーワードが比較され、結果リストが生成されます。

ナレッジベースのドキュメントの解析に使用する設定を定義するには、［ナレッジ］-［検索］-［パーサ設定］を選択し、［管理］タブを参照します。

パーサ設定が表示されます。設定を定義するには、以下のフィールドを使用します。

最大検索キーワード数

検索テキストが解析されるときに抽出されるキーワードの最大数を定義します。

デフォルト： 20

注：有効な範囲は 1 ～ 100 です。CA SDM の管理者は、この範囲内であれば、特定のナレッジデータベースのパラメータおよび検索ニーズに従って値を変更することができます。検索キーワード数を少なくすると、パフォーマンスが向上します。

言語

解析処理に使用する言語のタイプを指定します。以下のいずれかの設定を選択します。

英語

必要に応じて、検索時に日本語固有の特定の処理が実行されます。

ヨーロッパ言語

検索時に、ヨーロッパ言語特有の処理のみが実行されます。

韓国語

検索時に、韓国語言語特有の処理のみが実行されます。

その他アジア言語

検索時に、その他のアジア言語用の処理が実行されます。

注：中国語、日本語、または韓国語の環境で作業する場合、ナレッジマネジメントシステムを実装する前に、使用可能な解析方法および「マルチバイト文字セット（MBCS）を使用する言語」の制約を理解し、ユーザがシステムに見合った期待を持てるようにしておく必要があります。

有効な文字範囲

ドキュメントの［タイトル］、［概要］、［問題］、［解決策］の各フィールドを解析するときに有効とする英数字の範囲を定義します。範囲外の英数字は、区切り文字として処理されます。

注：［特殊用語を識別］リストで［はい］を選択すると、特殊用語として定義された語句やフレーズは解析されません。

デフォルト： a-z。英字「a」から「z」が解析で有効な文字です。

［有効な文字範囲］フィールドには、解析に使用する適切な文字を含めておく必要があります。［有効な文字範囲］フィールドに含まれていない文字は削除されます。

各言語で推奨される値は以下のとおりです。

言語 有効な文字範囲

ドイツ語 a-zäöüß

スペイン語 a-záéíóúüñ

フランス語 a-zàäâçéèêëîïôùû

ポルトガルのブラジル a-zàáãçéêíóúü

イタリア語 a-zàèéìîïù

中国語（簡体字） a-z

日本語 a-z

中国語（繁体字） a-z

韓国語 a-z

注：日本語には「a-z」の範囲のほかに、句読点を除くカタカナのリストが含まれます。

類似語を除外

検索で使用されるグループから、構造が似ているキーワードを削除するかどうかを指定します。以下のいずれかの設定を選択できます。

はい

構造が似ているキーワードは検索基準から除外されます。

注：［はい］を選択すると、ドキュメントを保存または発行するときにも、類似語が除外されます。この設定は、［類似語を除外］ボックスが［はい］に設定されている場合にドキュメントが検索可能かどうかに影響を与えます。類似語はインデックスが作成されず、後のドキュメントの取得および検索で使用されません。

いいえ

構造が似ているキーワードは検索基準から除外されません。

デフォルト： いいえ

ノイズワードを除外

ドキュメントの［タイトル］、［概要］、［問題］、および［解決方法］の各フィールドを解析するときに、ノイズワードを除外するかどうかを指定します。以下のいずれかの設定を選択できます。

はい: ノイズワードは検索基準から除外されます。
いいえ: ノイズワードは検索基準から除外されません。

デフォルト： はい

特殊用語を識別

ドキュメントの［タイトル］、［概要］、［問題］、および［解決策］の各フィールドを解析するときに、特殊用語を単一エンティティとみなすか、または複数エンティティとみなすかを指定します。以下のいずれかの設定を選択できます。

はい: 特殊用語は、検索基準で単一エンティティとして処理されます。
いいえ: 特殊用語を構成する語句は、検索基準で別のエンティティとして処理されます。

デフォルト： はい