SQL Server Data Quality Services Túlio de Souza (tss2)

Slides:



Advertisements
Apresentações semelhantes
Ferramentas OLAP: MicroStrategy OLAP Services
Advertisements

DFD - Diagrama de Fluxo de Dados
‘ Por que estudar sistemas de informação?
Modelo de Maturidade de Empresas de Médio Porte para BPIO
ISO Processos do Ciclo de Vida do Software
Tipos de sistemas de Lehman
E-business: Como as Empresas Usam os Sistemas de Informação.
Tópicos Motivação para teste Por que algumas empresas não testam
Disciplina:Tópicos Avançados de Sistemas de Informação
Gerenciamento da Integração
O processo de coletar os requisitos (escopo do cliente)
Preço IBM Service Manager for Smart Business em torno de R$6.000,00 por usuário o preco so é mantido para empresas MidMarket / por usuário Preço referência.
SISTEMAS DE INFORMAÇÃO EMPRESARIAIS
Conjunto de ferramentas e técnicas que objetivam dar suporte à
Control Objectives for Information and related Technology
Gerenciamento de Requisitos com Casos de Uso
Configuração de manutenção
SARC 2.0 ( System Audit Risk Control)
Semana 1 Conceitos Básicos e Infra-estrutura
Cuide da informação, ela é o bem mais precioso de sua empresa.
DOCUMENTO CONFIDENCIAL DA MICROSOFT Set 2009 | Página 1 | Apresentação para BDMs.
Curso Superior de Tecnologia: Sistemas para Internet
Tomada de Decisão e Sistemas de Informação
Administração de Sistema Operacional de Rede WindowsServer-2003 WindowsServer-2003 Ricardo de Oliveira Joaquim TECNOLÓGICOS.
Políticas de Backup FATEC – Americana
Apresentação de Trabalho de Conclusão de Curso Sisitemas de Informação
Especificação de Requisitos de Software - ERSw
Web Services Uninorte Semana de Tecnologia da Informação
Metolodogia de Desenvolvimento de Data Warehouse
Business Intelligence:
Tecnologia da informação
Módulo: Gerenciamento de Incidentes e
Gerência de Configuração - GC
Por que estudar sistemas de informação?
ADVOCA Solução Jurídica
Gerenciamento de conteúdo e automação de processos de trabalho com o novo 2007 Microsoft Office system.
Microsoft Azure Apresentação de visão geral para parceiros
Estratégia Organizacional
Desenvolvimento e uso de Sistemas de Informação
Objetivos do Capítulo Explicar a importância da implementação de processos e tecnologias de gerenciamento de dados numa organização. Explicar as vantagens.
Engenharia de Software
RUP - Cap. 4 – Processo Centrado na Arquitetura
Sistema de Informação e Tecnologia TRABALHO 5: “Data Warehouse” Thaís Araújo Lemos da Silva.
Click to edit Master subtitle style 11/18/09 Gerenciamento de Congressos Carlos M., Daniel R., Rafael H. e Caio G. Desenvolvimento de Software III – 2010/1.
Explorando dados e extraindo informações – Plataforma de BI Felipe Ferreira –
Gestão da Tecnologia da Informação
RequisitePro Ismênia Galvão Lourenço da Silva ANÁLISE E ESPECIFICAÇÃO DE REQUISITOS CENTRO DE INFORMÁTICA UNIVERSIDADE FEDERAL DE PERNAMBUCO.
Sistemas de Informação para Planejamento Estratégico Data Warehouse.
Automação Comercial Faculdade Estácio Radial Prof. Paulo Alipio Alves de Oliveira 2010.
Distribuição de Software Alexandre Vasconcelos © Centro de Informática Universidade Federal de Pernambuco.
É a etapa dos trabalhos de auditoria onde se definide a natureza dos exames (quais os procedimentos a serem aplicados), a extensão dos exames (quanto será.
Projeto Gesttor B.I..
Banco de Dados Representa o arquivo físico de dados, armazenado em dispositivos periféricos, para consulta e atualização pelo usuário. Possui uma série.
Conceitos de Monitoramento
Linguagem Técnica II SCM Software Configuration Management Aula 03 Prof. Renato Novais
Superintendência de Gestão da Informação
Aula 02 de Eng. de Requisitos
Universidade Federal de Pernambuco Ambiente para Integração Contínua Rafael Vanderlei de Souza 06/12/2008 Programa de Mestrado em Ciência.
FATEC – Americana Diagnóstico e solução de problemas em TI
Eduardo C. Nicácio ITIL v3 Foundation Certified.  As melhores práticas do ITIL abrangem cinco processos de suporte a serviços, além do papel do Service.
Objetivos do Capítulo Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel.
RCASOLUÇÕESGERENCIAIS QUEM SOMOS OBJETIVOS DA PARCERIA PLANO DE TRABALHO PRINCIPAIS ENVOLVIDOS (PLAYERS) RESULTADOS (ROI) 1 2.
Planejamento Estratégico Planejamento Estratégico de de Tecnologia de Informação Prof. Antonio Márcio M. Carmo Prof. Antonio Márcio M. Carmo.
Professora Roberta Peracio
INTELIGÊNCIA EMPRESARIAL Aula 8 - Metadados e Operações OLAP.
ADMINISTRAÇÃO INTERDISCIPLINAR
Testes de Unidade. 2 Pauta Testes de Unidade; Testes de Unidade; Desenvolvimento orientado a testes; Desenvolvimento orientado a testes; Testes unitários.
SQL Saturday #488 Gerenciamento de múltiplas instâncias de SQL Server Vitor Fava
O Processo Unificado (PU). 2 O que é o Processo Unificado (PU)? É um modelo de processo de software baseado no modelo incremental, visando a construção.
Transcrição da apresentação:

SQL Server Data Quality Services Túlio de Souza (tss2)

Roteiro 1. Motivação 1. Visão geral sobre qualidade de dados 2. Qualidade de dados nas organizações 2. Objetivo 3. Conceitos do Data Quality Services do SQL Server 1. Componentes do DQS 2. Bases de conhecimento 3. Domínio 4. Projetos de qualidade de dados 5. Limpeza de dados 4. Estado da arte do DQS 5. Demonstração prática dos conceitos apresentados 6. Referências

Motivação Informação tem se tornado um dos principais ativos de uma empresa Dados de má qualidade podem gerar: Falhas em processos de negócios Custos relacionados a áreas organizacionais Perda total ou parcial de clientes Qualidade de dados em DW 80% das Empresas empresas afirmam que lidam com a má qualidade dos dados Menos de 52% das empresas consideram fazer uma auditoria de qualidade dos dados.

Motivação Qualidade de dados é um conceito complexo pois possui significados diversos para diferentes negócios e pessoas É preciso identificar as necessidades da empresa, quando lidamos com a qualidade dos dados Custos adicionais Perdas financeiras Nível de dependência em processos automatizados de tomada de decisões Data Quality Services do SQL Server ainda é pouco difundido nas organizações.

Objetivo Apresentar a importância da qualidade de dados nas organizações Explicar os principais conceitos do DQS Base de conhecimento Projeto de qualidade de dados Limpeza de dados Serviços de dados de referência Demonstrar como o DQS funciona na prática Apresentar as vantagens do uso do DQS

Conceitos Data Quality Services (DQS) é uma solução de limpeza de dados baseada em uma base de dados de conhecimentos lançada no SQL Server Permite a criação de bases de conhecimento na qual nos baseamos para fazer a limpeza e desduplicação de dados. Os conhecimentos de uma base de dados podem melhorar com o tempo e ser reusada em outras soluções.

Conceitos Gerenciamento do conhecimento e dados de referência Criar e gerenciar bases de conhecimento no DQS Descobrir os conhecimentos baseados nos dados da organização Explorar e integrar dados de referências de outras organizações Limpeza e correspondência de dados Corrigir, desduplicar e padronizar dados Administração Monitorar os processos de qualidade de dados

Conceitos

Componentes do DQS O QDS consiste de um Data Quality Server e o Data Quality Client O Data Quality Server é uma das funcionalidade da instância do SQL Server O Data Quality Client é uma aplicação windows que permite aos administradores de dados e profissionais de TI fazer operações de qualidade de dados Criação e gerenciamento da base de dados Criar e manter projetos de qualidade de dados Monitorar processos de qualidade de dados Gerenciar configurações do sistema

Conceitos

Bases de conhecimento Para tratar os dados é preciso conhecimento sobre eles É um reposiótio de dados que permite aos profissionais entender seus dados e manter sua integridade Os conhecimentos em uma base de conhecimentos é mantida em domínios, cada um específico para um campo de dados.

Conceitos Dominios Domínios tratam da semântica dos dados Podem ser usados com dados de referências online Online DataMarketReference Data Service Serviços de referência de dados de terceiros Os processos incluem: Gerenciamento de domínios - Definir os domínios Descobrimento de conhecimento - Definir valores para os domínios Políticas de correspondência - Para identificar possíveis dados duplicados

Conceitos

Projeto de qualidade de dados Um projeto de qualidade de dados é a maneira de usar a base de dados de conhecimento criada anteriormente para executar os processos de limpeza e correspondência de dados. Criado e gerenciado no Data Quality Client Os resultados podem ser exportados para uma tabela do SQL Server, arquivo de excel ou arquivo CSV. Dois tipos: Atividade de limpeza - Os dados processados são categorizados como novos, inválidos, corrigidos e corretos. Atividade de correspondência - Usado para prevenir duplicação de dados identificando repetições e repetições aproximadas.

Conceitos O processo de limpeza de dados As configurações do processo envolvem: Definição da conexão a um servidor de Qualidade de dados Seleção da base de conhecimentos Mapeamento das colunas da fonte com os domínios Os resultados incluem os dados originais e os dados corrgidos juntamente com o status da atividade.

Estado da Arte DQS presente na instalação do SQL Server 2014 Data Quality Services Client - v Data Quality Services Server - v Ferramenta ainda pouco difundida e utilizada nas organizações Tendência de crescimento e desenvolvimento da ferramenta muito alta, tendo em vista o presente valor dos dados em uma organização. A preocupação com a qualidade dos mesmos tem sido crescido nos últimos anos.

Exemplos de aplicações

Dados exportados após processamento pelo DQS

Dúvidas ?

Referências 1. Presentation: Introducing SQL Server 2012 Data Quality Services. Disponível em acessado em 21/11/ Introduction to Data Quality Services. Disponível em br/library/ff877917(v=sql.120).aspx, acessado em 21/11/ br/library/ff877917(v=sql.120).aspx 3. Uma visão sobre a qualidade de dados. Disponível em visao-sobre-a-qualidade-dos-dados/6973, acessado em 21/11/ visao-sobre-a-qualidade-dos-dados/ A qualidade de seus dados é boa o suficiente para o seu projeto de Business Intelligence? Disponível em acessado em 21/11/2015. A qualidade de seus dados é boa o suficiente para o seu projeto de Business Intelligence? 5. SQL SERVER – Step by Step Guide to Beginning Data Quality Services in SQL Server 2012 – Introduction to DQS. Disponível em by-step-guide-to-beginning-data-quality-services-in-sql-server-2012-introduction-to-dqs/, acessado em 21/11/ by-step-guide-to-beginning-data-quality-services-in-sql-server-2012-introduction-to-dqs/