Como apresentado no post anterior, após efetuarmos a parte de Knowledge Discovery da nossa base de conhecimento – http://social.technet.microsoft.com/wiki/pt-br/contents/articles/12607.data-quality-services-dqs-knowledge-discovery.aspx
 iremos agora realizar o outro passo chamado de Matching Policy.

 

Introdução

Esse é outro recurso que possibilita o enriquecimento das informações dentro da nossa base de conhecimento (KB). Políticas são definidas para cada “domínio” e assim podemos analisar e verificar inconsistências.

Para darmos início a esse processo iremos abrir nosso projeto anterior.

 

Untitled

(Figura 1 – Selecionando a opção Matching Policy.)

 

Map (Mapeamento)

Esse é o processo de mapeamento com a fonte de dados que você deseja analisar.

image

(Figura 2 – Visualizando os Domínios criados na nossa base de conhecimento.)

 

Com isso iremos comparar nossos domínios com o (Análise DQS Matching Policy.XLSX) –https://skydrive.live.com/#cid=6E894476A77CD2F2&id=6E894476A77CD2F2%21142

 

Nesse momento iremos realizar o mapeamento dos campos que serão comparados com nossos domínios.

 

image

(Figura 3 – Realizando o mapeamento entre EXCEL e a Base de Conhecimento (KBM).)

 

Possuímos algumas opções, como:

Adicionar mais colunas para o mapeamento, remover colunas, criar um novo domínio, domínio composto e ainda visualizar a fonte de dados que especificamos, nos caso o EXCEL.

 

image

(Figura 4 – Opções do Painel de Matching Policy.)

 

image

(Figura 5 – Realizando o Preview do EXCEL pelo DQS.)

 

Matching Policy

 Após mapeamento dos dados agora iremos realizar a criação de algumas Políticas. Para cada registro é aplicado a Política e assim o mesmo é validado.

image
(Figura 6 – Criação de novas políticas.)

 

image

(Figura 7 – Painel de Criação de Políticas.)

 

image

(Figura 8 – Adicionando um domínio para o processo de Matching.)

 

image

(Figura 9 – Validação de Estado Civil sendo criado.)

 

Untitled

(Figura 10 – Opçõe de Similaridade.)

 

Para cada política criada, possúimos duas opções de Similaridade:

 

• Similar

Quando selecionado ele realiza a busca dos dados de acordo com a porcentagem de similaridade, ou seja palavras que sejam similares a do dóminio que será comparado.

• Exact (Exato)

Quando a comparação é exata. então só será validado com palavras totalmente iguais, sendo assim possuir 100%.

 

A opção de Weight é utilizada quando possuímos mais de um domínio na regra. Com isso esse componente irá determinar para cada domínio o valor de comparação, sendo que o total deve ser 100%.

 

A opção Prerequisite quando especificado, seleciona automaticamente a similaridadde como Exato, isso porque ele só irá comparar valores totalmente iguais.

 

Iremos realizar a criação das Seguintes Políticas com as mesma opções,  Min. matching score = 80%, e similaridade SIMILAR com isso teremos:

 

• Validação Estado Civil

• Validação Sexo

• Validação Tipo de Telefone

• Validação Título

 

image

(Figura 11 – Políticas criadas.)

Resultado

Agora iremos realizar a comparação da informações, com isso será possível realizar o Matching das informações.

Após realizar a execução vemos que:

image

(Figura 12 – O valor vindo do Excel = CELULA, com isso temos um Score de 82%.)

 

Untitled

(Figura 13 – Visualizando o Matching das Informações.)

 

 Após realizado todo esse processo de criação de Políticas para complementar sua base de conhecimento, no próximo post criaremos um projeto de Qualidade dos dados e assim trataremos e visualizaremos melhor nossas informações dentro do banco de dados.