SCC Bancos de Dados e Suas Aplicações

Slides:



Advertisements
Apresentações semelhantes
PROJETO DE PESQUISA (Caderno de Metodologia da Unisul)
Advertisements

Administração de Sistemas de Informação
Conferência realizada no Departamento de Medicina Preventiva e Social
INTELIGÊNGIA COMPUTACIONAL
O COMPUTADOR COMO MEIO E COMO FIM
Metodologia Científica e Tecnológica
NOÇÕES PRELIMINARES.
Redes Neurais Artificiais
Interação Homem-Máquina
Introdução aos Sistemas Gerenciadores de Banco de Dados
2/18/2014Mestrado em Ciencia da Computacao Tópicos Especiais Mineração de Dados Profa. Sandra de Amo Mestrado em Ciência da Computação Faculdade.
POWER POINT 2007 Introdução Colégio Conde Domingos
Ontologia para Sistemas Configurarionais Urbanos
Mineração de Dados ou Descoberta de conhecimento em BDs
Análises Espaciais e Tomada de Decisão
Iana Alexandra Alves Rufino
Metodologias para Aplicações Ambientais
O Surgimento dos Sistemas de Bioinformática
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Pesquisa (cap. 8, Marconi e Lakatos)
Instituto Tecnológico da Aeronáutica – ITA Divisão de Ciência de Engenharia Eletrônica e Computação EE-09 Inteligência Artificial Prof. Adilson Marques.
Prof. Everton Lopes Bonifácio
O uso dos softwares nas escolas
TIPOS DE TESTES APLICÁVEIS E NÃO APLICÁVEIS AO PROJETO
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
UFRPE – Modelos de Qualidade Teresa Maciel
Método Hipotético-dedutivo Segundo Bunge
Pesquisa de mercado e comportamento
ADMINISTRAÇÃO DE SISTEMAS DE INFORMAÇÃO
Treinamento do Microsoft® Access® 2010
2.1. O USO MERCADOLÓGICO DA DISCUSSÃO EM GRUPO c
METODOLOGIA DE PESQUISA PESQUISAS QUALITATIVAS X QUANTITATIVAS
visão global do projeto Professora: Geórgia Fortes
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
1.
Redes Bayesianas - Aplicação em Risco Operacional
Fundamentos de Metodologia
Pesquisa Científica Metodologia Científica na Ciência da Computação
Reconstrução Tridimensional usando IPP Trabalho final do curso de Visão Computacional DCC / UFMG Apresentação: Antônio Wilson Vieira.
Seleção de Atributos Ricardo Prudêncio.
Tópicos Avançados em Inteligência Artificial
METODOLOGIA DA PESQUISA CIENTÍFICA
MESTRADO EM REDES DE COMPUTADORES
Profa. Flávia Santos Metodologia da Pesquisa Extraído de: Roesch, Yin e metodologia da UFPR e UFSC Profa. Flávia Santos
Campus de Caraguatatuba Aula 2: Introdução a Tecnologia de BD
RUP - Cap. 4 – Processo Centrado na Arquitetura
INE5644 – Data Mining Profa Vania Bogorny
Como Melhorar a Tomada de Decisão
Computer & Education Tópicos Especializados em Engenharia de Software Alexandre Barbosa Cazeli Denis Colli Spalenza.
Gestão de projetos de Software GTI-16
Mineração de Dados: Introdução
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
SOFTWARES EDUCACIONAIS – CÓD PROF. MSC. RONNISON REGES VIDAL.
Abordagem Sistemática Guilherme Amaral Avelino Avaliação e Controle de Sistemas de Informação.
Projeto de Banco de Dados
Professora Michelle Luz
INTELIGÊNCIA ARTIFICIAL Grupo: Amora Figueiredo Érika Diniz
Teorias do Jornalismo. Itens do trabalho jornalístico  Pontos fixos de observação  Divisão do trabalho no interior do jornal  Hierarquia profissional.
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
PROJETO DE PESQUISA AVALIAÇÃO DA QUALIDADE NA GESTÃO DO TRÁFEGO URBANO ATRAVÉS DO ESTUDO DO BENCHMARKING ENTRE OS CENTROS DE CONTROLE.
PROPOSTA DE METODOLOGIA PARA UMA MATRIZ ENERGÉTICA REGIONAL.
PESQUISA E METODOLOGIA CIENTÍFICA
PREPARAÇÃO DE UM ARTIGO CIENTÍFICO
INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.
TEMA DA AULA A Pesquisa Científica e suas fases. OBJETIVOS DA AULA Compreender os aspectos gerais da pesquisa contemplando a elaboração de relatórios,
ADMINISTRAÇÃO INTERDISCIPLINAR
Apresentação ApresentaçãoApresentaçãoApresentação.
NOÇÕES PRELIMINARES. Propostas desse estudo Identificar os fatores que ajudam no processo de planejamento e controle da investigação; Identificar os fatores.
Técnicas de Avaliação de Interfaces Prof. Jorge Cavalcanti.
Transcrição da apresentação:

SCC0141 - Bancos de Dados e Suas Aplicações Visualização de Informação Prof. Jose Fernando Rodrigues Junior

Roteiro Introdução Alguns Conceitos Esquemas visuais mais usados Interação, Sistematização e Processamento Observações Conclusivas

Questões a serem respondidas O que é Visualização de Informações? Por que seu uso? Princípios Técnicas mais usuais Exemplos de sistematização Estado da arte Como obter mais informações sobre o assunto? Nesta apresentação pretende-se introduzir a ciência de visualização de informações. Ao final desta apresentação pretende-se se capaz de responder às seguintes questões.

O que é? A prática de se beneficiar das capacidades cognitivas visuais para se expressar conhecimento de maneira mais rápida e intuitiva. Também denominada Infovis Exemplo: a invasão francesa da Rússia

O problema Dados Transferência de dados Humano Objetivo: discernimento

Fatos  Evolução do Hardware Dobro do processamento a cada 18 meses (Moore’s Law) Dobro de tecnologia gráfica a cada 12 meses Tendência observada já há 50 anos  Crescimento da produção/fluxo de dados Apenas em 2010, estimativa de 5 zetabytes (270 B) O armazenamento de novas informações tem crescido à taxa de mais de 30 % ao ano

Fatos  Evolução do Hardware Dobro do processamento a cada 18 meses (Moore’s Law) Dobro de tecnologia gráfica a cada 12 meses Tendência observada já há 50 anos Pelo menos mais 10 anos “O propósito da computação é compreensão, e não números.” Richard Hamming (Turing Award, 1968)  Crescimento da produção/fluxo de dados Zetabyes: http://www.guardian.co.uk/technology/blog/2011/jun/29/zettabyte-data-internet-cisco Apenas em 2010, estimativa de 5 zetabytes (270 B) O armazenamento de novas informações tem crescido à taxa de mais de 30 % ao ano

Fatos  Não evolução do ser humano Em contraste, habilidades humanas básicas não mudam ao longo do tempo As técnicas de Visualização de Informações reduzem este problema.  Conseqüência Bancos de dados com uma quantidade de dados muito maior do que é possível para o ser humano aproveitar

Exibição de dados – diferentes abordagens Computação gráfica: como renderizar? Visualização científica: como reproduzir graficamente? Visualização de informações: como definir um design que personifique meus dados?

Exibição de dados – diferentes abordagens Tabela Balancete Trimestre Faturamento 1 70 2 20 3 5 4 Computação gráfica: como renderizar? Visualização científica: como reproduzir graficamente? Visualização de informações: como definir um design que personifique meus dados?

Ciência Analítica Objetivos: Avaliar Prever Identificar alternativas Suporte à decisão Artefatos de racionalização, hierárquicos: Elementares: dados individuais, suposições, evidências... Padrões analíticos: correlação, tendência, classificação, relacionamento, exceções, agrupamentos, estrutura, ... Artefatos de ordem superior: inferência lógica (se então, por exemplo), casualidade temporal, modelos de regressão (padrões funcionais), ... Complexos: hipóteses e cenários (explicações)

Ciência Analítica Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação)

Ciência Analítica Principal abrangência da visualização Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação)

Ciência Analítica Principal abrangência da visualização Mineração de dados e raciocínio suportado por visualização Principal abrangência da visualização Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação)

Ciência Analítica Principal abrangência da visualização Profundo conhecimento de domínio Mineração de dados e raciocínio suportado por visualização Principal abrangência da visualização Artefatos Elementares Ex.: dados e suposições Padrões Analíticos Ex.: tendência, classificação, relacionamento, agrupamentos,... Artefatos de Ordem Superior Ex.: inferência lógica (se então, se e somente se), modelos de regressão Hipóteses E Cenários (previsão, avaliação, explicação)

Ciência Analítica Objetivos: Artefatos de racionalização: Outros recursos: Descartes R. 1637. Discourse on Method; Jones M. 1995. The Thinker’s Toolkit: 14 Powerful Techniques for Problem Solving. Three Rivers Press; Heuer R. 1999. Psychology of Intelligence Analysis. U.S. Government Printing Office; Adams JL. 2001. Conceptual Blockbusting: A Guide to Better Ideas. Fourth edition, Perseus Publishing. Objetivos: Avaliar Prever Identificar alternativas Suporte à decisão Artefatos de racionalização: Elementares: dados individuais, suposições, evidências... Padrões analíticos: correlação, tendência, classificação, relacionamento, exceções, agrupamentos, estrutura, ... Artefatos de ordem superior: inferência lógica (se então, por exemplo), casualidade temporal, modelos de regressão (padrões funcionais), ... Complexos: hipóteses e cenários (explicações)

Roteiro Introdução Alguns Conceitos Esquemas Visuais mais Usados Interação, Sistematização e Processamento Observações Conclusivas

Princípio da Visualização Dados Transferência de dados Humano

Princípio da Visualização Os olhos têm acesso privilegiado ao cérebro Mais de 50 % do cérebro é dedicado à visão

Recursos – pré-atenção Mecanismo da visão, duas fases 1ª. Fase: pré-atenção instantânea e em paralelo 2ª. Fase: varredura demorada e seqüencial Quantos números “4” há na cena?

Recursos – pré-atenção Estímulos pré-atentivos 4 canais PE PI PL DIR ESQ PD PA PB PJ PK PC IDEOL. PART.  Cor PB PD PE PA PI PJ PL PK PC PB PD PE PA PI PJ PL PK PC

Recursos – pré-atenção Estímulos pré-atentivos 4 canais PE PI PL DIR ESQ PD PA PB PJ PK PC IDEOL. PART.  Posição PB PD PE PA PI PJ PL PK PC PA PB PD PE PC PI PJ PL PK

Recursos – pré-atenção Estímulos pré-atentivos 4 canais PE PI PL DIR ESQ PD PA PB PJ PK PC IDEOL. PART. PB PD PE PA PI PJ PL PK PC PB PD PI PJ PA PC PL PE PK  Forma

Recursos – pré-atenção Estímulos pré-atentivos 4 canais PE PI PL DIR ESQ PD PA PB PJ PK PC IDEOL. PART. PE PA PI PK  Tempo (animação cor, posição e/ou forma) PA PI PE PK

Recursos – pré-atenção Estímulos pré-atentivos

Recursos – pré-atenção Estímulos pré-atentivos Posição: 1D, 2D e 3D; Forma: ponto, linha, área, volume, orientação, comprimento, colinearidade, tamanho, curvatura; Cor: matiz, saturação, brilho, textura; Tempo (animação): movimento e intermitência.

Recursos – pré-atenção Estímulos pré-atentivos Mas o que isso tem a ver com computação? Auxílio computacional: escalabilidade de dados (via SGBDs) e de processamento interação: redefinição em tempo real da apresentação de dados dimensão temporal algorítmico: combinação com mineração de dados Posição: 1D, 2D e 3D; Forma: ponto, linha, área, volume, orientação, comprimento, colinearidade, tamanho, curvatura; Cor: matiz, saturação, brilho, textura; Tempo (animação): movimento e intermitência.

Recursos – pré-atenção Mecanismo da visão, duas fases 1ª. Fase: pré-atenção instantânea e em paralelo 2ª. Fase: varredura demorada e sequencial Procedimento geral da visualização (Visualization Mantra): Visão geral (1ª. fase) Zoom & filtragem (Interação) Detalhes sob demanda (2ª. Fase)

Recursos – pré-atenção Qual o estado com maior nível salarial? Qual a relação entre salário e educação? Comportamentos incomuns (outliers)?

Recursos – pré-atenção Nível educacional (% com curso superior) Salário annual Per Capita (U$)

Recursos: pré-atenção  percepção  raciocíonio

Recursos: pré-atenção  percepção  raciocíonio Observação Raciocínio Interpretação (padrões analíticos): Correlação Tendência Classificação Relacionamento Sumarização Exceções Agrupamentos Estrutura Leitura, ... Pré-atenção: Posição Forma Cor Tempo Percepção (padrões visuais): Correspondência Diferenciação Conectividade Arranjo Significado Variação

Recursos: pré-atenção  percepção  raciocíonio Conhecimento de domínio Projeto/ Sistematização/Utilização Etapa natural com pouca carga cognitiva Geração de conclusões com base no domínio dos dados Observação Raciocínio Interpretação (padrões analíticos): Correlação Tendência Classificação Relacionamento Sumarização Exceções Agrupamentos Estrutura Leitura, ... Pré-atenção: Posição Forma Cor Tempo Percepção (padrões visuais): Correspondência Diferenciação Conectividade Arranjo Significado Variação

Recursos: pré-atenção  percepção  raciocíonio Canal: Posição ● Forma ● Cor ● Tempo ● Padrões visuais: ● Correspondência ● Diferenciação ● Conectividade ● Arranjo ● Significado ● Variação

Recursos: pré-atenção  percepção  raciocíonio

Demonstração Mundo: Renda X Emissão de Carbono PROJEÇÃO ANIMADA Dados de IDH Ano Nome do país Tamanho da população Grupo de renda Renda per capita (U$) Emissão de CO2 (ton/pessoa) Software: Gapminder (spreadsheet do Google Docs) Análise Geral Percepções Posição: correspondência, arranjo Forma: correspondência, diferenciação, conectividade, significado Cor: correspondência Animação Interpretações: Correlação Tendência Classificação Exceções Agrupamentos Estrutura Leitura Mundo: Renda X Emissão de Carbono

Demonstração Mundo: Fertilidade X População PROJEÇÃO ANIMADA Dados de IDH Ano Nome do país Filhos por mulher Tamanho da População Renda per capita Grupo de renda Software: Gapminder (spreadsheet do Google Docs) Mundo: Fertilidade X População

Como a visualização pode ajudar? 1. Mais Recursos Processamento perceptivo paralelo Percepção ao invés de cognição Expansão das memórias de curto e longo prazo do usuário 2. Busca Reduzida Informações agrupadas reduzem a varredura sequencial Leitura espacial instantânea 3. Melhor Reconhecimento de Padrões Reconhecer ao invés de relembrar Abstração e agregação Exposição estrutural Valor, relacionamento, tendência

Como a visualização pode ajudar? 4. Inferência Perceptiva Alguns problemas se tornam óbvios O raciocínio é amplificado com pistas visuais 5. Monitoramento Perceptivo Alterações visuais saltam aos olhos 6. Mídia Manipulável Interação

Mundo: Distribuição de renda Demonstração Mundo: Distribuição de renda

Demonstração Mundo: Distribuição de renda

Linhas Gerais de Aplicação Tarefas Exploração analítica Descobrir hipótese Apresentação confirmatória Verificar hipótese Suporte à decisão Avaliar, prever, identificar alternativas Apresentação simples Apresentar o que você já sabe

Linhas Gerais de Aplicação Tipos de dados Multi-dimensional (tabular) Bancos de dados relacionais Redes e árvores (grafos) Redes sociais, redes de recomendação, redes de computadores, localização geográfica Textos e documentos Repositórios de texto (artigos, notícias, wikis) Espacial-temporal (1D, 2D, 3D e 4D) Simulação e reprodução de fenômenos científicos

Projeto e desenvolvimento

Transformações do Dados Sistematização Sistema de Visualização Dados “crus” Dados estruturados Design Visual Visualização Transformações do Dados Mapeamento Visual Transformações Visuais Dados Formato Visual Processamento Pré-visualização Técnicas de Visualização Técnicas de Interação Visual 45

Roteiro Introdução Alguns Conceitos Esquemas Visuais mais Usados Interação, Sistematização e Processamento Observações Conclusivas

Esquemas visuais mais usados Projeções geométricas Técnicas iconográficas Técnicas hierárquicas Técnicas orientadas a pixels Classificação que segue à organização visual

Projeção geométrica Coordenadas Paralelas X2 X2: 10 10 X0 X0: 5 X1 X1: 1 X3 X3: 7 Atributo 0 Atributo 1 Atributo 2 Atributo 3 48

Projeção geométrica Coordenadas Paralelas Dados de veículos Milhas Por Galão # Cilindros (CYLINDERS) Autonomia (DISPLACEMENT) Potência (HORSEPOWER) Peso (WEIGHT) Aceleração (ACCELERATION) Ano (YEAR) Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções Posição: correspondência, arranjo Forma: conectividade Cor: diferenciação Interpretações: Correlação Tendência Sumarização Classificação Exceções Base de Dados

Matriz de Scatter Plots Projeção dos atributos combinados Correlação Projeção geométrica Matriz de Scatter Plots MATRIZ DE SCATTER PLOTS Dados de veículos Milhas Por Galão # Cilindros (CYLINDERS) Autonomia (DISPLACEMENT) Potência (HORSEPOWER) Peso (WEIGHT) Aceleração (ACCELERATION) Ano (YEAR) Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções Posição: correspondência, arranjo Interpretações: Correlação Tendência Exceções Matriz de Scatter Plots Projeção dos atributos combinados Correlação

Projeção geométrica Table Lens Dados de filmes Rank de arrecadação (RANK) Lançamento (RELEASE DATE) Arrecadação (CUMULATIVE GROSS) Distribuidora (DISTRIBUTOR) Título (TITLE) Software: Table Lens Análise Geral Percepções Posição: correspondência, arranjo Forma: correspondência, significado Cor: diferenciação Interpretações: Correlação Tendência Classificação Exceções Leitura

Peso: 5 Aceleração: 2 Peso: 10 MPG: 1 Potência: 5 Técnicas Iconográficas Star Glyphs Peso: 5 Aceleração: 2 Peso: 10 MPG: 1 Potência: 5

# DE CILINDROS MPG PESO # DE CILINDROS MILHAS POR GALÃO (MPG) POTÊNCIA Técnicas Hierárquicas Sobreposição Dimensional # DE CILINDROS MPG PESO # DE CILINDROS MILHAS POR GALÃO (MPG) POTÊNCIA

Técnicas Hierárquicas Treemaps

Técnicas Orientadas a Pixels Padrões de Arranjo Design Arranjo dos pixels: apresentação depende da ordem Mapeamento de cores por valor de atributo

Esquemas visuais mais usados Projeções geométricas Técnicas iconográficas Técnicas hierárquicas Técnicas orientadas a pixels

Roteiro Introdução Alguns Conceitos Esquemas Visuais mais Usados Interação, Sistematização e Processamento Observações Conclusivas

Interação e Sistematização Interação: alteração dos parâmetros de posição, de forma e de cor Principais: Filtragem interativa: alteração de cor (brushing) e de forma (contorno de seleção) Transformação Espacial/Zoom: alteração de forma (escala) e de posição (rotação e translação) Distorção: alteração de posição (diferentes perspectivas) Sistematização com expansão do espaço de exibição: Visões interligadas (linked-views) Múltiplos espaços de visualização Visualização em multi-resolução O analista pode “sentir” melhor a cena de análise, aumentando as possibilidades de interpretação visual.

INTERAÇÃO VIA FILTRAGEM INTERATIVA E LINK & BRUSH SISTEMATIZAÇÃO POR VISÕES INTERLIGADAS (linked-views) Dados de veículos Milhas Por Galão # Cilindros (CYLINDERS) Autonomia (DISPLACEMENT) Potência (HORSEPOWER) Peso (WEIGHT) Aceleração (ACCELERATION) Ano (YEAR) Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções Posição: correspondência, arranjo Forma: conectividade Cor: diferenciação Interpretações: Correlação Tendência Sumarização Classificação Exceções

TRANSFORMAÇÃO ESPACIAL INTERAÇÃO VIA TRANSFORMAÇÃO ESPACIAL Dados de cidades Nome (CIDADE) Estado (UF) Latitude Longitude Software: FastMapDB Análise Geral Percepções Posição: correspondência, significado Cor: correspondência Interpretações: Classificação Estrutura Agrupamentos Leitura Ciência Analítica Visual

INTERAÇÃO VIA DISTORÇÃO Dados de filmes Ano de produção Distribuidora (DISTRIBUTOR) Título (TITLE) Gênero Software: TimeWall Análise Geral Percepções Posição: correspondência Forma: diferenciação, significado Cor: correspondência Interpretações: Tendência Classificação Exceções Agrupamentos Leitura Ciência Analítica Visual

Interação - Distorção espacial StarTree

Processamento: pré-processamento e suporte estatístico Redução de dimensionalidade: n-dimensional  k-dimensional, onde n < k Agregação: por exemplo, sumarização estatística Seleção: por exemplo, amostragem Segmentação: por exemplo, particionamento hierárquico

REDUÇÃO DE DIMENSIONALIDADE E INTERAÇÃO POR TRANSFORMAÇÃO ESPACIAL Dados de exames de câncer (biopsia) Identificador (ID) 9 exames laboratoriais Classificador (CLASS) Software: FastMapDB Análise Geral Percepções Posição: correspondência, arranjo Cor: correspondência Interpretações: Classificação Estrutura Exceções Agrupamentos

AGREGAÇÃO ESTATÍSTICA Dados de veículos Milhas Por Galão # Cilindros (CYLINDERS) Autonomia (DISPLACEMENT) Potência (HORSEPOWER) Peso (WEIGHT) Aceleração (ACCELERATION) Ano (YEAR) Origem (AMER., EUROP., JAP.) Software: VisTree Análise Geral Percepções Posição: correspondência, diferenciação, arranjo Forma: correspondência, diferenciação, conectividade Cor: correspondência, diferenciação Interpretações: Sumarização Correlação Relacionamento Tendência Classificação Exceções Agrupamentos Ciência Analítica Visual

BoxPlot – Visão geral da distribuição de variáveis

BoxPlot – Visão geral da distribuição de variáveis

Roteiro Introdução Alguns Conceitos Esquemas Visuais mais Usados Interação, Sistematização e Processamento Observações Conclusivas

Comparação com Mineração de Dados Extração não trivial de informações implícitas, potencialmente úteis e previamente desconhecidas Caracteristicamente algorítmica

Comparação com Mineração de Dados Algoritmos de Mineração de Dados Visualização de Informações Objetivo + – Mensurável Flexível Interativo Visualização de Informações + Algoritmos de Mineração de Dados

Comparação com Mineração de Dados Visualização de Informações Algoritmos de Mineração de Dados Visualização de Informações Objetivo + – Mensurável Flexível Interativo Mineração Visual de Dados: utilização de Visualização de Informações para monitorar, guiar ou se beneficiar de algoritmos de Mineração de Dados. Visualização de Informações + Algoritmos de Mineração de Dados

Mineração de Dados Exemplo: monitoramento visual do algoritmo k-medoid para detecção de clusters.

Algoritmo k-medoid: Selecione os elementos que serão os centros dos agrupamentos Verifique todos os pontos do conjunto e atribua a cada ponto o agrupamento referente ao centro mais próximo Recalcule os centros dos agrupamentos de acordo com os agrupamentos definidos Enquanto os centros trocarem de posição, vá para o passo 2 Minimizar

Design de técnicas de visualização e interação. Estado da Arte Procedimentos sistemáticos de análise: ● avaliação ● planejamento ● tomada de decisão. Design de técnicas de visualização e interação. Formalização do fato de que a ciência de InfoVis engloba uma série de disciplinas, todas inter-relacionadas. Tecnologias de dados: ● armazenamento ● disponibilização ● gerenciamento. Formatos de dados versáteis, orientados à análise. Disponibilização e difusão. A Ciência Analítica Visual [2]

Avaliação de técnicas de análise visual de dados Tema amplo Critérios: Funcionalidade – as funcionalidades esperadas são oferecidas? Efetividade – a técnica agrega valor? Novas descobertas nos dados? Eficiência – a técnica promove melhor desempenho? Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza? Utilidade – é possível se beneficiar da técnica? Metodologias: Avaliação analítica: baseada em modelos e em testes estruturados; Avaliação empírica: quantitativa ou qualitativa

Avaliação de técnicas de análise visual de dados Tema amplo Critérios: Funcionalidade – as funcionalidades esperadas são oferecidas? Efetividade – a técnica agrega valor? Novas descobertas nos dados? Eficiência – a técnica promove melhor desempenho? Usabilidade – qual é a dificuldade em se usar o sistema? Há clareza? Utilidade – é possível se beneficiar da técnica? Metodologias: Avaliação analítica: baseada em modelos e em testes estruturados; Avaliação empírica: quantitativa ou qualitativa Há subjetividade semelhante ao que se observa em HCI (Human-Computer Interaction); Devido ao contexto analítico, nem sempre as técnicas de HCI podem ser aplicadas sem adaptação; Da mesma forma, há metodologias bastante satisfatórias, mas com alto custo de aplicação.

Avaliação de técnicas de análise visual de dados DECIDE1: um arcabouço para avaliação de sistemas Determine os objetivos: o quê se quer avaliar? Enumere questões relevantes sobre os objetivos; Escolha a metodologia de avaliação: slide anterior; Identifique os fatores práticos: usuários, equipamento, dados, ... Gerencie as questões éticas; Avalie, interprete e apresente os resultados. 1 J. Preece, Y. Rogers, and H. Sharp, Interaction Design. John Wiley & Sons, Inc., 2002

Disseminação SAP: incorporou (da Inxight) as técnicas StarTree, TableLens e TimeWall em seus produtos TIBCO (Spotfire): comercializa técnicas como Coordenadas Paralelas, Scatter Plots e TreeMaps Advanced Visual Systems (AVS): abrange soluções para a indústria e para a academia Outras empresas: Advizor Solutions, Compudigm, Dimension 5, Infommersion, Macrofocus, Purple Insight, ... Listagem completa: http://kisd.de/~marian/infovis/

Linhas de Desenvolvimento 1. Paradigmas de Interação Orientados ao usuário E.g.: perspective view Orientados a sistema E.g.: linked views 2. Suporte da Ciência da Computação Componentes E.g.: Graph-Tree Aperfeiçoamentos E.g.: Keim’s color space

Linhas de Desenvolvimento 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/

Linhas de Desenvolvimento 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/

Linhas de Desenvolvimento Ainda há muito o que se fazer em:  visualização de dados relacionais escalabilidade de dados uso combinado com mineração de dados visualização 3D interativa utilização da dimensão temporal (animação) 3. Novos Designs E.g.: Gapminder E.g.: Table Lens 4. Suporte Teórico Espaços de Design E.g.: design orientado à percepção Estudo do sistema perceptivo E.g.: princípios de manipulação direta 5. Suporte de Desenvolvimento Componentes E.g.: OpenGL Toolkits E.g.: IVTK http://ivtk.sourceforge.net/

Discussão A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para estes benefícios.

Discussão A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para estes benefícios.

Discussão A visualização pode resolver todos os meus problemas de análise de dados? R.: Não. Análise de dados é um processo elaborado que requer profundo conhecimento de domínio, objetivos claros e trabalho intenso. Posso trabalhar sem visualização, então? R.: Não. Apesar de seus limites, a visualização provê benefícios bastante favoráveis, e não há substituto para tais benefícios.

Livros Básicos Visualização de Informações Robert SPENCE. “Information Visualization”, ACM Press, 2001 Stuart K. Card, Jock D. MacKinlay, Ben Shneiderman, Mackinlay Card (eds.). “Readings in Information Visualization: Using Vision to Think”, Morgan Kaufmann Series in Interactive Technologies, Academic Press, 1999. ISBN 1- 55860-533-9 Colin WARE. “Information Visualization: Perception for Design”, Morgan Kaufmann Interactive Technologies Series, January 2000. ISBN 1-55860-511-8

Livros Básicos Mineração de Dados K. Cios et. al. - “Data Mining: A Knowledge Discovery Approach”, Springer, 2007 Jiawei Han, Micheline Kamber. “Data Mining: Concepts and Techniques”, Morgan Kaufmann, 2006 Pang-Ning Tan, Michael Steinbach, Vipin Kumar. “Introduction to Data Mining”, Addison Wesley, 2005

Outras áreas de visualização Visualização Científica Visualização de Software Visualização Geográfica Visualização de Redes Ciência Analítica Realidade Virtual Realidade Aumentada Sonificação (som) Háptica (tato)

Referências [1] “How Much Information?” Lyman P and HR Varian, 2003. Disponível em http://www.sims.berkeley.edu/how-much-info. [2] “Illuminating the Path: The Research and Development Agenda for Visual Analytics” James J. Thomas and Kristin A. Cook, editors. IEEE Press, 2005. Disponível em http://nvac.pnl.gov/agenda.stm. Software: www.icmc.usp.br/~junio