実装ガイド › アダプタ設定の指定 › DataSourceInterface セクション
DataSourceInterface セクション
DataSourceInterface セクションは、アダプタおよびデータ ソース(測定ツール、CRM、システム ログなど)の間の接続および接続タイプを指定する属性から構成され、2 つの主要なタイプに分類されます: ファイル インターフェースおよび SQL インターフェース。
ファイル インターフェース
ファイル アダプタは、ログ ファイル、スケジュール済みレポート、またはその他のテキスト ベースのファイルからデータを取得するために使用できます。DataSourceInterface は、ファイル データ ソースからの情報を解析し、それをフィールドに抽出するルールを定義します。
DataSourceInterface セクションでは、アダプタがソース ファイルを扱う方法(元のファイルがアダプタ用にのみ作成されている場合にファイルを削除するかどうか、またほかの目的で使用する場合にデータを維持するかどうかなど)も定義します。
XML 構造:
<DataSourceInterface WorkFileName="MyWorkingFile.txt" >
<Files>
<File
IsActive="yes"
InputFormat="events"
Path="D:\adapters\sample_data\"
NamePattern="adapterXXX*.log"
DeleteFileAfterProcessing="no"
Delimiters=","
IgnoreRedundantDelimiters ="no"
TitleExists="no"
SleepTime="10">
</File>
</Files>
</DataSourceInterface>
- WorkFileName - (オプション)。 DeleteFileAfterProcessing が「no」に設定されている場合、ファイルはこの名前のファイルにコピーされ、「yes」に設定されている場合は、ファイルの名前がこの名前に変更されます。 指定されていない場合は、デフォルト値が使用されます(「WorkFile.txt」)。
- Files - ファイル エレメントのコレクション(1 つのアダプタに複数のファイルを定義できます)。
- File - ファイルの属性を指定します。
- IsActive - (オプション)[yes/no]。 このファイルがアクティブであるどうかを定義します(「no」に設定すると、このファイルは読み取られません)。
- InputFormat - このファイルに関連付けられている入力フォーマット。 アダプタは InputFormat を使用してデータ ソースからデータを抽出します。
- Path - ソース データ ファイルの場所へのパス。
- NamePattern - データ ソースのファイル名を指定します。 複数のファイルで同じ入力フォーマットが使用される場合は、ワイルドカードを使用できます。
- DeleteFileAfterProcessing[yes | no] - アダプタがソース ファイルを扱う方法。 ファイルがアダプタ用にのみ作成され、処理の後に削除できる場合は、「yes」に設定します。 ファイルは、名前が変更され、処理が行われた後に削除されます。「no」に設定すると、ファイルはコピーされ、コピーされたファイルに対して処理が行われます。 このファイルに新規レコードが追加された場合、アダプタは次のサイクルでこれらの新規レコードをワーク ファイルにコピーします。 このファイルに新規レコードが追加されていない場合、アダプタは、現在のファイルと同じパターンを持ち、(辞書式順序で)名前が大きい最初のファイルを検索します。 アダプタがそのようなファイルを見つけると、そのファイルの処理を開始します。 このファイルに新規レコードが追加されても、アダプタは前のファイルに戻りません。 ソース ファイルの整合性を維持する必要がある場合は、「no」を使用します。
- InitialFileName - アダプタが指定されたパターンでファイルの検索を開始する最初のファイルの名前。 NamePattern にワイルドカードが含まれていて、アダプタが古いファイルを読み取らないようにする場合は、この属性を使用します。
- Delimiters - (オプション)。 区切り文字として使用する 1 文字以上の文字。これに従ってデータ行がフィールドに解析されます。指定しない場合、デフォルト値は「\t」です。
- IgnoreRedundantDelimiters - (オプション)[yes/no]。 「yes」に設定すると、連続する区切り文字は 1 文字として扱われます。「no」に設定すると、区切り文字の間に空白のフィールドが作成されます。
- RegExForParser - (オプション)。 前に指定した区切り文字を置換して、データ ソースからフィールドを抽出するために使用する正規表現。 以下に例を挙げます。
<File
….
RegExForParser="^(.{8}) (.{6}) (?:[ ])*([0-9]+) "
/>
詳細については、正規表現のドキュメントを参照してください。
- TitleExists - (オプション)[yes/no]。データ ソース ファイル内の空白ではない最初の行がタイトル行であるかどうかを指定します。 タイトルは、データの解析時にアダプタが使用することができます。
- SleepTime - データ取得の間隔(秒)(つまり、アダプタがソース データ ファイルからデータを取得する間隔の秒数)を指定します。
- LogicLineDefinition - (オプション)
<File
….
<LogicLineDefinition
FirstLine="Job server:.*"
NumberOfLines="5"
/>
/>
データセットが 1 行ではなく複数の行から構成されている場合、以下の属性によって、抽出の開始位置、終了位置、および一組にするデータの行数を定義します。
- AllFile - (オプション)[yes/no]。「yes」に設定すると、ファイル内のすべてが 1 つのレコード(1 つの論理行)と見なされます。
- FirstLine - (オプション)論理行の最初の行を定義する正規表現。 LastLine または NumberOfLines(またはその両方)と一緒に指定できます(単独でも指定できます)。
- LastLine - (オプション)論理行の最後の行を定義する正規表現。 FirstLine または NumberOfLines(またはその両方)と一緒に指定できます(単独でも指定できます)。
- NumberOfLines - (オプション)論理行の行数。 FirstLine または LastLine(またはその両方)と一緒に指定できます(単独でも指定できます)。
- MatchCase - (オプション)[yes/no]。正規表現の比較で大文字と小文字を区別するかどうかを定義します。