Seção DataSourceInterface

Guia de Implementação › Especificações de configuração do conector › Seção DataSourceInterface

Seção DataSourceInterface

A seção DataSourceInterface consiste nos atributos que especificam a conexão e o tipo de conexão entre o conector e a fonte de dados (ferramenta de medição, CRM, log do sistema, etc.) e é dividida em dois tipos principais: interface de arquivo e interface SQL.

Interface de arquivo

O conector de arquivo pode ser usado para recuperar dados dos arquivos de log, relatórios programados ou qualquer outro arquivo de texto, e o DataSourceInterface define as regras usadas para analisar as informações da fonte de dados do arquivo e extraí-las para os campos.

A seção DataSourceInterface também define como o conector lida com o arquivo de origem (se ele exclui o arquivo original, caso tenha sido criado apenas para o conector, ou se mantém os dados como estão, caso sejam necessários a outros usos, e assim por diante).

Estrutura do XML:

<DataSourceInterface WorkFileName="MyWorkingFile.txt" >
   <Files>
	<File
            IsActive="yes"	
		InputFormat="events"
		Path="D:\adapters\sample_data\"
		NamePattern="adapterXXX*.log"
		DeleteFileAfterProcessing="no"
		Delimiters=","
		IgnoreRedundantDelimiters ="no"
		TitleExists="no"
		SleepTime="10">
	</File>	
   </Files>
</DataSourceInterface>

WorkFileName (opcional) - quando DeleteFileAfterProcessing está definido como 'no', o arquivo é copiado para esse nome, e quando está definido como 'yes', o arquivo é renomeado para esse nome. Se nenhum valor for especificado, será usado o padrão ('WorkFile.txt').
- Files - coleta dos elementos do arquivo (é possível definir mais de um arquivo por conector).
- File - especifica os atributos do arquivo.
  - IsActive [yes/no] (opcional) - define se o arquivo está ativo (quando definido como "no", esse arquivo não será lido).
  - InputFormat - especifica o formato de entrada associado ao arquivo. O conector usa o InputFormat para extrair os dados da fonte de dados.
  - Path - especifica o caminho dos arquivos da origem de dados.
  - NamePattern - especifica o nome do arquivo da fonte de dados. É possível usar caracteres curinga se mais de um arquivo usar o mesmo formato de entrada.
  - DeleteFileAfterProcessing [yes|no] - especifica a forma como o conector lida com o arquivo de origem. Quando o arquivo for criado apenas para o conector e puder ser excluído após o processamento, a definição deve ser "yes". O arquivo será, então, renomeado, processado e excluído. Se a definição for "no", o arquivo é copiado, e o processamento ocorrerá no arquivo copiado. Caso novos registros sejam adicionados ao final deste arquivo, o conector copia esses novos registros no arquivo de trabalho no próximo ciclo. Se não forem adicionados novos registros, o conector procura o primeiro arquivo com o mesmo padrão e um nome maior que o arquivo atual (em ordem lexicográfica). Se o conector localizar tal arquivo, ele prossegue o trabalho com ele. O conector não reverte para o arquivo anterior mesmo se novos registros forem adicionados ao arquivo. Use "no" quando precisar manter a integridade do arquivo de origem.
  - InitialFileName - especifica o nome do primeiro arquivo a partir do qual o conector fará uma pesquisa usando o devido padrão. Use este atributo quando NamePattern tiver caracteres curinga e você desejar que o conector leia arquivos antigos.
Delimiters (opcional) - especifica um ou mais caracteres que atuam como delimitadores, conforme os quais as linhas de dados serão dividas em campos. Se um valor não for definido, usa-se o padrão ("\t").
IgnoreRedundantDelimiters [yes/no] (opcional) - quando definido como "yes", os delimitadores consecutivos são tratados como um só. Caso contrário, será criado um campo em branco entre os delimitadores.
RegExForParser (opcional) - trata-se de uma expressão regular usada para extrair campos da fonte de dados substituindo os delimitadores especificados anteriormente. Por exemplo:
```
<File
    ….
    RegExForParser="^(.{8}) (.{6}) (?:[ ])*([0-9]+) "
/>
```
Consulte a documentação para obter mais detalhes sobre as expressões regulares.
TitleExists [yes/no] (opcional) - especifica se a primeira linha que não estiver em branco no arquivo de origem de dados é uma linha de título. O título pode ser usado pelo conector ao analisar os dados.
SleepTime - especifica o intervalo entre as recuperações de dados (em segundos), ou seja, os segundos decorridos entre cada recuperação de dados pelo conector a partir do arquivo de dados de origem.
LogicLineDefinition (opcional)
```
<File
    ….
    <LogicLineDefinition
                    FirstLine="Job server:.*"
                    NumberOfLines="5"
    />
/>
```
Caso o conjunto de dados tenha sido criado conforme um determinado número de linhas, e não em uma só linha, os seguintes atributos definem o ponto de início e o ponto de término da extração, bem como a quantidade de linhas de dados:
- AllFile [yes/no] (opcional) - quando definido como "yes", todo o arquivo é considerado como um só registro em uma linha lógica.
- FirstLine (opcional) - uma expressão regular que define a primeira linha da linha lógica. Ela pode ser especificada com e sem LastLine e/ou NumberOfLines.
- LastLine (opcional) - uma expressão regular que define a última linha da linha lógica. Ela pode ser especificada com e sem FirstLine e/ou NumberOfLines.
- NumberOfLines (opcional) - especifica a quantidade de linhas em uma linha lógica. Ela pode ser especificada com e sem FirstLine e/ou LastLine.
- MatchCase [yes/no] (opcional) - define se a expressão regular correspondente diferencia maiúsculas e minúsculas.

Enviar email à CA Technologies sobre este tópico