Pentaho Data Integration

Slides:



Advertisements
Apresentações semelhantes
Lexium Motion Controller - LMC
Advertisements

SQL Avançado Continuação
SISTEMAS DE INFORMAÇÃO Sistemas de Bancos de Dados I 2º Semestre – 2010 Pedro Antonio Galvão Junior Fone:
ArcToolbox Carlos Ruberto Fragoso Júnior www. ctec. ufal
Operadores Especiais da SQL
Banco de Dados Oracle AESO.
Oficina sobre banco de dados
CAD (Caco Aided Design)
SCC Bancos de Dados e Suas Aplicações
Star Schema Benchmark SSB
Extração, transformação e carga (ETL)
Tutorial Condor Juliano Freitas da Silva
Estudo de caso e solução baseada em data warehouse
Sistemas Operacionais SISTEMA DE ENTRADA E SAÍDA
1 Felipe L. SeverinoPOD XtremWeb Felipe L. Severino Programação com Objetos Distribuídos paralela e.
Estrutura e funcionamento de um computador
Bases de dados.
Query Tuning Lílian Simão Oliveira.
Banco de Dados Avançado - Prof.ª Valeria Times
Tecnologias.NET Equipe: Ayrton Johab Rejane Roosevelt Wanessa.
Implantação de um Centro de Processamento de Alto Desempenho sobre recursos não-dedicados Andamento das atividades Abmar Barros.
Camada de sessão, apresentação e aplicação
Streams –input e output
Integração com Banco de Dados
Apresentação do Sistema
O QUE HÁ DE NOVO NO SECULLUM MINI ACADEMIA.NET
JSP / Servlets Avançado
Gestão de Base de Dados Este trabalho foi realizado por: André Andrade
APRESENTAÇÃO DO SOFTWARE
Pensando grande para você, pensando grande com você. pw.ETL.
APRESENTAÇÃO DO SOFTWARE
4. Decisões Estruturadas 4.1. Data Warehouse (DW)
Tecnologia da informação Aula 1 – Introdução - Fundamentos dos componentes do Sistema de Informação. Profº Erich.
Introdução ao MATLAB 5.3 para Hidrólogos
Carlos Vinícius Rasch Alves MARCA SISTEMAS
Plataforma Microsoft de BI
Introdução à Informática
Banco de Dados Parte 04 Ceça. Ceça Moraes 2 Conteúdo  Os três níveis da arquitetura  Mapeamentos  Arquitetura cliente-servidor.
TREINAMENTO QUESTOR EMPRESARIAL
Fusion ECM Suite Arquitetura Integração SAP.
Apresentação do Sistema
Guia de Treinamento Fusion ECM Suite - Relatórios.
SQLite Banco de Dados II.
SQL Server Comando PIVOT.
WDM Web Data Modeling UCB – Universidade Católica de Brasília
Alberto Raposo – PUC-Rio INF 1366 – Computação Gráfica Interativa X3D – Event Utilities e Scripting Alberto B. Raposo
Jacques Robin CIn-UFPE Arquiteturas de software e linguagens de consultas para descoberta de conhecimento em BD.
Fórmula Visual RM.
Kettle Paulo Silva Amorim Rodolfo Ribeiro de Oliveira
UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO PROJETO FINAL
Ellison Siqueira (erms)
Prof. Jacques Robin Sala C41 Pesquisa: * Inteligência Artificial  Banco de Dados  * Inteligência Artificial  Sistemas.
Lojas de Informática e eletrônicos
Daniel Paulo Backup Para evitar perdas de informações importantes, será necessário criar estratégias para a implementação de.
Daniel Paulo Introdução Importação e exportação de dados são procedimentos comuns para Sistemas. Além disso, é normal ter que.
Microsoft SQL Server Instruções para instalação/ recuperação de bancos de dados no SQL Server.
Janeiro/2013 Ceça Moraes Data Warehouse Janeiro/2013 Ceça Moraes
Integração de dados Bernadette, Ceça, Luciano, Haroldo, Guilherme. Orientadora: Ana Carolina Salgado Universidade Federal de Pernambuco Pós-Graduação em.
Methodology Explorer Uma ferramenta para definição e manutenção de metodologias de software Hermano Perrelli Suzana Mesquita Recife, outubro de 2001.
Pentaho BI Server Ceça Moraes Outubro/2015.
INTEGRAÇÃO DE DADOS: UMA PERSPECTIVA TEÓRICA Guilherme P. K. Caminha Disciplina: IF696.
Prof. Abrahão Lopes 18 de Setembro de 2013.
Capturando Dados Históricos com Change Data Capture Arthur Luz | MCSA & MCT em SQL Server
Introdução Programação (PG) Pedro Alexandre Pereira Centro de Cálculo Instituto Superior de Engenharia de Lisboa.
Atividade ASP.NET Portal da Memoria Atividade Desenvolver uma aplicação ASP.NET com funcionalidade similar à existente no site centenário.ifrn.edu.br utilizando.
1 MEI, ARMD 2004, Gabriel David Armazéns de Dados Mapeamentos e instalação Gabriel David
Arquitetura. Arquitetura 4Insights 4Insights Data Modeler 4Insights Data Upload 4Insights Data Loader Data Warehouse InfiniDB; RedShift; Oracle Hexadata;
سیستم‌های تصمیم‌یار تعریف پایگاه داده تحلیلی مدل منطقی مدل فیزیکی
Transcrição da apresentação:

Pentaho Data Integration Ceça Moraes Setembro/2015

Pentaho Data Integration (PDI) PDI ou Kettle http://community.pentaho.com/ http://sourceforge.net/projects/pentaho/files/Data%20Integration/5.4/pdi-ce-5.4.0.1-130.zip/download Componente da suite do Pentaho responsável pelos processos de ETL Extraction, Transformation and Load Descompactar numa pasta

Outra Aplicações do PDI Migração de dados entre aplicações/banco de dados Exportar dados de banco de dados para outros formatos Limpeza de dados

Componentes PDI Spoon Pan Kitchen Carte Criação de transformações e jobs Pan Execução de transformações com agendamento em intervalos Kitchen Execução de jobs com agendamento em intervalos Carte web server para execução remota de transformações e jobs

Kettle

Transformação Conjunto de passos interligados ou não Contém fontes e saídas dos dados Conceito de stream (fluxo de dados) = entrada e saída de um passo Uma transformação para cada dimensão Arquivos *.KTR do Spoon

Passos (Steps) Unidade mínima da transformação Grande variedade de tipos Input, Output, Joins,... Tipos básicos: entrada, transformação, saída

Passos (Steps)

Hops Links entre os steps Indicam fluxo dos dados (streams) Origem e destino

Jobs Conjunto para execução de várias transformações Arquivos *.KJB do Spoon

Tcharan...

Etls no Pentaho Data integration (Kettle)

Base Operacional: northwind

Data Warehouse: Vendas

Conexões

Conexões

Dimensão: Produto

Dimensão Produto

Tipo de Steps Tipos de steps utilizados Table Input (da aba “Input”) Dimension lookup/update (da aba “Data Warehouse” Execute SQL Script (da aba “Scripting”)

Dimensão Produto

Dimensão Produto

Dimensão Produto

Dimensão Produto

Fato Vendas

Fato Vendas

Tipo de Steps Tipos de steps utilizados Table Input (da aba “Input”) Database lookup (da aba “Lookup” Select Values (da aba “Transform”)

Tipo de Steps Tipos de steps utilizados Memory Group By (da aba “Statistics”) Table Output (da aba “Output”

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Fato Vendas

Mãos à obra e divirtam-se!!! 