Depois de termos realizado a criação de uma base de conhecimento – http://social.technet.microsoft.com/wiki/pt-br/contents/articles/12606.data-quality-services-dqs-domain-management.aspx#Domain_Management  iremos agora adicionar informações para ela.

 

Introdução

Podemos realizar  a inserção manual de valores para nossa base de conhecimento, com isso podemos usar essa atividade para automatizar uma parte desse processo. Para isso, iremos abrir a nossa base de conhecimento, só que agora selecionando a opção Knowledge Discovery

Untitled

(Figura 1 – Abrindo o banco de conhecimento para a atividade Knowledge Discovery.)

 

Map (Mapeamento)

Esse processo consiste em identificar uma fonte de informações na qual você deseja analisar, após selecionar os dados, os mesmos serão comparados com a base de conhecimento e analisados de acordo com o seu negócio. A fonte de análise pode ser um EXCEL ou uma tabela / view do SQL Server.

O propósito desse recurso é identificar se é necessários a inserção de novos valores ou novos domínios para complementar sua base de conhecimento, nesse caso iremos realizar a análise vindo de um EXCEL – (Análise DQS Knowledge Discovery)https://skydrive.live.com/#cid=6E894476A77CD2F2&id=6E894476A77CD2F2%21142. Iremos realizar a comparação das informações com nossa base de conhecimento, para que assim se necessário possamos adicionar conhecimento para a mesma.

 

image

(Figura 2 – Selecionando Excel e realizando o mapeamento dos campos com a base de conhecimento.)

 

Discover (Explorar)

Logo após clicar em Next, você irá para a parte de descoberta das informações. Nesse processo o DQS realizará o matching das informações do EXCEL com a base de conhecimento e logo depois nos dará informações sobre o procedimento.

 

image

(Figura 3 – Iniciando o processo de Discover entre as bases. O Profiler identificará as informações como Total de Valores, valores únicos, novos valores dentre outros.)

 

 

image

(Figura 4 – Informações geradas pelo Profiler.)

 

As informações do Profiler geraram as seguintes saídas:

image

(Figura 5 – Informações do Processo de Discover.)

 

• Pre-Processing Records

Esse processo consistem em carregar as informações e realizar a preparação do profiler para as informações capturadas. Nesse processo temos a quantidade total de registros processados pelo DQS assim como o tempo de duração do processo.

• Running Domain Rules

Nesse momento as regras do DQS são aplicadas e assim validadas e mostradas no Profiler.

• Running Disvovery

O DQS realiza a análise dos dados que poderão ser adicionados a base de conhecimento. Nessa fase de execução o processo mostra a porcentagem de sucesso.

 

Após o processamento:

image

(Figura 6 – Estatísticas do Profiler.)

 

image

(Figura 7 – Informações do processo do profiler.)

 

O DQS realizou a análise das informações, e com isso foi constatado que temos novos valores, assim como a quantidade total de valores que foram análisados. Em cada campo temos a quantidade de novos valores assim como valores únicos e valores que são válidos no nosso domínio criado.

image

(Figura 8 – Quantidade de novos valores descobertos.)

 

Com isso foi encontrado para cada Domínio uma quantidade de novos registros. Com isso podemos analizá-lo e ver se o mesmo é valido para nosso negócio.

 

Managing Domain Values (Gereciando Valores do Domínio.)

 

Agora iremos verificar e conformar esse novos valores encontrados pelo processo do profiler.

Para o nosso Dóminio cargo e Estado, temos novos valores  que são válidos então por isso não iremos realizar nenhuma intervenção, com isso esses novos valores serão adicionados para nossa base de conhecimento.

 

image

(Figura 9 – Novos valores para o domínio Cargo.)

 

image

(Figura 10 – Novos valores para o domínio Estado Civil.)

 

No sexo, temos uma inconformidade, os valores Femi e Masc são incorretos de acordo com a regra do nosso negócio, por isso esses valores serão corrigidos para Masculino e Feminino.

image

(Figura 11 – Informações sendo corrigidas para o domínio Sexo.)

 

Agora para nosso último domínio validado, iremos ver que um valor irá ser adicionado, outro irá permanecer incorreto, e os outros serão corrigidos e adicionados para o nossa base de conhecimento.

image

(Figura 12 – Informações endo corrigidas e adicionadas para o domínio Título.)

 

Após isso iremos realizar a publicação das alterações na base de conhecimento.

image

(Figura 13.1 – Realizando a publicação da base.)

 

image

(Figura 13.2 – Base publicada com sucesso.)

 

Verificando as informações adicionadas na nossa base de conhecimento.

image

(Figura 14 – Novos valores adicionado no domínio Cargo.)

 

image

(Figura 15 – Novos valores adicionado no domínio Estado Civil.)

 

image

(Figura 16 – Novos valores adicionado no domínio Sexo.)

 

image

(Figura 17 – Novos valores adicionado no domínio Título.)

 

E assim terminados um dos processos para aprimoramento de noss base de conhecimento, no próximo post iremos falar sobre Matching Policy.