Guia de Implementação › Especificações de configuração do conector › Seção DataSourceInterface
Seção DataSourceInterface
A seção DataSourceInterface consiste nos atributos que especificam a conexão e o tipo de conexão entre o conector e a fonte de dados (ferramenta de medição, CRM, log do sistema, etc.) e é dividida em dois tipos principais: interface de arquivo e interface SQL.
Interface de arquivo
O conector de arquivo pode ser usado para recuperar dados dos arquivos de log, relatórios programados ou qualquer outro arquivo de texto, e o DataSourceInterface define as regras usadas para analisar as informações da fonte de dados do arquivo e extraí-las para os campos.
A seção DataSourceInterface também define como o conector lida com o arquivo de origem (se ele exclui o arquivo original, caso tenha sido criado apenas para o conector, ou se mantém os dados como estão, caso sejam necessários a outros usos, e assim por diante).
Estrutura do XML:
<DataSourceInterface WorkFileName="MyWorkingFile.txt" >
<Files>
<File
IsActive="yes"
InputFormat="events"
Path="D:\adapters\sample_data\"
NamePattern="adapterXXX*.log"
DeleteFileAfterProcessing="no"
Delimiters=","
IgnoreRedundantDelimiters ="no"
TitleExists="no"
SleepTime="10">
</File>
</Files>
</DataSourceInterface>
- WorkFileName (opcional) - quando DeleteFileAfterProcessing está definido como 'no', o arquivo é copiado para esse nome, e quando está definido como 'yes', o arquivo é renomeado para esse nome. Se nenhum valor for especificado, será usado o padrão ('WorkFile.txt').
- Files - coleta dos elementos do arquivo (é possível definir mais de um arquivo por conector).
- File - especifica os atributos do arquivo.
- IsActive [yes/no] (opcional) - define se o arquivo está ativo (quando definido como "no", esse arquivo não será lido).
- InputFormat - especifica o formato de entrada associado ao arquivo. O conector usa o InputFormat para extrair os dados da fonte de dados.
- Path - especifica o caminho dos arquivos da origem de dados.
- NamePattern - especifica o nome do arquivo da fonte de dados. É possível usar caracteres curinga se mais de um arquivo usar o mesmo formato de entrada.
- DeleteFileAfterProcessing [yes|no] - especifica a forma como o conector lida com o arquivo de origem. Quando o arquivo for criado apenas para o conector e puder ser excluído após o processamento, a definição deve ser "yes". O arquivo será, então, renomeado, processado e excluído. Se a definição for "no", o arquivo é copiado, e o processamento ocorrerá no arquivo copiado. Caso novos registros sejam adicionados ao final deste arquivo, o conector copia esses novos registros no arquivo de trabalho no próximo ciclo. Se não forem adicionados novos registros, o conector procura o primeiro arquivo com o mesmo padrão e um nome maior que o arquivo atual (em ordem lexicográfica). Se o conector localizar tal arquivo, ele prossegue o trabalho com ele. O conector não reverte para o arquivo anterior mesmo se novos registros forem adicionados ao arquivo. Use "no" quando precisar manter a integridade do arquivo de origem.
- InitialFileName - especifica o nome do primeiro arquivo a partir do qual o conector fará uma pesquisa usando o devido padrão. Use este atributo quando NamePattern tiver caracteres curinga e você desejar que o conector leia arquivos antigos.
- Delimiters (opcional) - especifica um ou mais caracteres que atuam como delimitadores, conforme os quais as linhas de dados serão dividas em campos. Se um valor não for definido, usa-se o padrão ("\t").
- IgnoreRedundantDelimiters [yes/no] (opcional) - quando definido como "yes", os delimitadores consecutivos são tratados como um só. Caso contrário, será criado um campo em branco entre os delimitadores.
- RegExForParser (opcional) - trata-se de uma expressão regular usada para extrair campos da fonte de dados substituindo os delimitadores especificados anteriormente. Por exemplo:
<File
….
RegExForParser="^(.{8}) (.{6}) (?:[ ])*([0-9]+) "
/>
Consulte a documentação para obter mais detalhes sobre as expressões regulares.
- TitleExists [yes/no] (opcional) - especifica se a primeira linha que não estiver em branco no arquivo de origem de dados é uma linha de título. O título pode ser usado pelo conector ao analisar os dados.
- SleepTime - especifica o intervalo entre as recuperações de dados (em segundos), ou seja, os segundos decorridos entre cada recuperação de dados pelo conector a partir do arquivo de dados de origem.
- LogicLineDefinition (opcional)
<File
….
<LogicLineDefinition
FirstLine="Job server:.*"
NumberOfLines="5"
/>
/>
Caso o conjunto de dados tenha sido criado conforme um determinado número de linhas, e não em uma só linha, os seguintes atributos definem o ponto de início e o ponto de término da extração, bem como a quantidade de linhas de dados:
- AllFile [yes/no] (opcional) - quando definido como "yes", todo o arquivo é considerado como um só registro em uma linha lógica.
- FirstLine (opcional) - uma expressão regular que define a primeira linha da linha lógica. Ela pode ser especificada com e sem LastLine e/ou NumberOfLines.
- LastLine (opcional) - uma expressão regular que define a última linha da linha lógica. Ela pode ser especificada com e sem FirstLine e/ou NumberOfLines.
- NumberOfLines (opcional) - especifica a quantidade de linhas em uma linha lógica. Ela pode ser especificada com e sem FirstLine e/ou LastLine.
- MatchCase [yes/no] (opcional) - define se a expressão regular correspondente diferencia maiúsculas e minúsculas.