Após termos passado pelo projeto de limpeza das informações (Data Cleansing), http://social.technet.microsoft.com/wiki/pt-br/contents/articles/12609.data-quality-services-dqs-cleasing-project.aspx
 podemos também realizar o projeto de Matching de dados. Esse projeto consiste em realizar a comparação das informações e assim verificar a proximidade e semelhança da mesma. Nesse processo possúimos 3 fases.

 

Map (Mapeamento)

Eric-Fischer-Locals-and-Tourists-SFBase-map-OpenStreetMap-CC-BY-SA

(Figura 1 – Mapeamento de Estruturas.)

 

O primeiro passo é realizar o mapeamento das Políticas criadas com a fonte de dados que desejamos comparar. Com isso teremos as regras de cada Política sendo comparada com os registros das fontes de dados, permitindo assim o mapeamento completo das informações.

 

image

(Figura 2 – Realizando a criação de um novo projeto.)

 

image

(Figura 3 – Políticas que já foram criadas.)

 

image

(Figura 4 – Nome do projeto e selecionando a base de conhecimento (KB).)

 

image

(Figura 5 – Projeto de Matching das informações.)

Matching (Correspondência)

Nesse passo iremos realizar o mapeamento das informações com a fonte de dados.

 

image

(Figura 6 – Conectando com a fonte de dados para a realização do processo de matching dos dados .)

 

image

(Figura 7 – Realizando o mapeamento das Políticas criadas com os campos da fonte de dados.)

 

Após isso iremos realizar o processo de Matching, nesse momento o DQS irá ler todas as informações e irá aplicar a lógica de matching e com isso iremos ter a saída das seguintes informações:

 

image

O Profiler dará o resultado de todos os dados que foram analisados, com isso teremos: quantidade de registros, novos valores, dentre outros.

 

image 

(Figura 8 – Painel do Profiler.)

 

image

Informações das Políticas criadas para a base de conhecimento (KB).

 

image

(Figura 9 – Painel de Regras criadas.)

 

image

O resultado de todas as comparações realizadas.

 

image

(Figura 10 – Painel de Estatísticas.)

 

image

(Figura 11 – Visualizando os dados comparados e suas informações.)

 

Export (Exportação)

Depois de visualizarmos todas as informações, agora iremos realizar a exportação desses resultados. Para isso possuímos duas opções:

Matching Results

Esse processo inclui os dados que foram encontrados e os que não foram.

Survivorship Results

Nesse processo só será incluído os registros correspondentes. Esse processo irá preserver os registros do Cluster que possui relação com os registros correspondentes.

 

 

image

(Figura 12 – Realizando a exportação das informações.)