Finalizando o DQS com a parte de administração – http://social.technet.microsoft.com/wiki/pt-br/contents/articles/12691.data-quality-services-dqs-administracao.aspx , iremos entender o pacote do DQS dentro do SQL Server Integration Services.

SQL Server Integration Services (SSIS)

Nas versões anteriores do SSIS, o processo de limpeza dos dados se dava usandoDerived Column ou Script Transformation, porém a criação desses componentes dentro do SSIS se tornava muito complexo. Agora é possível ter um serviço próprio para a limpeza de dados, o DQS Cleansing Transformation possui a habilidade de realizar a limpeza e conformidade das informações.

Com isso, iremos realizar a criação de um projeto no SSIS para realizar a utilização desse novo recurso.

 

image
(Figura 1 – Realizando a criação do projeto.)

 

 

Utilizando o DQS Cleansing

 

Logo após o projeto criado, iremos realizar a conexão com o banco de dados DQS.Bak –https://skydrive.live.com/#cid=6E894476A77CD2F2&id=6E894476A77CD2F2%21142.

 

image

(Figura 2 – Buscando as informações no Banco de dados – DQS.)

 

image

(Figura 3 – Tabela dbo.DadosDQS.)

 

A tabela dbo.DadosDQS possui as informações nas quais iremos comparar com nosso domínios criados dentro da nosssa base de conhecimento (KB) no DQS.

 

Após realizarmos a conexão com a fonte na qual iremos confrontar as informações, iremos utilizar o novo serviço.

 

image

(Figura 4 – Selecionando o DQS Cleansing.)

 

image

(Figura 5 – Aba – Configuration Manager.)

 

Nesta parte, realizamos a conexão com a base de conhecimento (KB) do DQS. Logo após conectado, selecionamos a “Base de Conhecimento” e assim é mostrado todos os nossos domínio criados.

 

image

(Figura 6 – Aba – Mapping.)

 

Na parte de mapeamento, iremos realizar o cruzamento dos campos com os domínios que desejamos comparar.

 

image

(Figura 7 – Aba – Advanced.)

 

Nesta parte temos algumas opções, que são:

• Standardize Output

Essa opção esta como padrão, e automaticamente padroniza a saída das informações de acordo com os formatos de cada domínio.

 

• Enable Field-Level Columns

Selecionando essa opção, irá acrescentar o valor de confiança entre os registros comparados, assim será possível ver a porcentagem de proximidade entre os valores.

 

• Enable Record-Level Columns

Se durante o mapeamento de um dóminio e o serviço de normalização das informações retornar valores o mesmo será incluído na saída das informações.

 

E por final, selecionamos a saída das informações que serão comparados nesse processo de Cleansing.

 

image

(Figura 8 – Saída das informações para uma tabela do banco de dados DQS.)

 

image

(Figura 9 – Criação da tabela.)

 

Concluindo a operação.

 

image

(Figura 10 – Realizando a comparação e importação das informações.)

 

image

 

image

 

image

(Figura 11 – Os dados para serem analisados.)

 

Pronto agora temos o processo finalizado com sucesso.