A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Visualização da Informação

Apresentações semelhantes


Apresentação em tema: "Visualização da Informação"— Transcrição da apresentação:

1 Visualização da Informação
Ana Cecília - Iandé Coutinho – Érick Gomes 04/11/2008 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

2 Agenda Visualização de Informação Processo de Geração de Visualização
Redução de Dimensionalidade – PCA Ferramenta PEX Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio 2

3 Recuperação da informação
Tradicionalmente: Baseado em palavra-chave Limitação de exibição: Apresentação do resultado por lista linear Relacionamentos entre os documentos não é ilustrado Sem interação do usuário  Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

4 Recuperação da informação
Ex: Usuários realizando buscas na Internet obtêm facilmente um volume enorme de informações Dificuldades de selecionar as informações relevantes Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

5 Recuperação da informação
Como melhorar a exibição dos resultados? Visualização da informação! Segundo Card, a Visualização de Informação é o uso de representação visual, interativa e suportada por computador, de dados abstratos para ampliar a cognição. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

6 Visualização da Informação
Por que visualização? Informações representadas graficamente tendem a ser processadas de maneira mais automática pela visão. Aumenta a percepção do usuário Aumenta o processo de cognição e inferência Fornece navegação sobre os dados obtenção de uma visão geral visão detalhada (zooming, filtragem) identificação de relacionamentos Identificação de padrões Percepção! auxiliar os indivíduos a enxergarem um fenômeno associado ao dado, usando a percepção para diminuir o esforço cognitivo facilitar o processo de entendimento de informação a partir da análise visual de conjuntos de dados. possibilitam ao usuário manipular essa representação de modo a melhor compreender o conjunto de dados ali representado NAVEGAÇÃO Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

7 Visualização da Informação
Por que visualização? A visualização de informações permite a apresentação de dados em formas gráficas de modo que o usuário possa utilizar sua percepção visual para melhor analisar e compreender as informações Análise de dados realizada com mecanismos computacionais, mas também recursos da visão e da cognição humana. -Uma abordagem para contornar as dificuldades de selecionar as informações relevantes dentre os resultados de buscas é utilizar técnicas de visualização de informações -o usuário obtém uma representação visual que, se por um lado abstrai detalhes do conjunto de informações, por outro propicia uma organização desse conjunto segundo algum critério. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

8 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Exemplo Densidade populacional Americana: Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

9 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

10 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

11 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Visualização em RI Procura transformar em uma representação gráfica e interativa um conjunto de dados brutos. Processo de Visualização em RI Transformar dados brutos em estruturas visuais Projetar uma informação no espaço Informações organizadas têm estruturas espaciais intrínsecas: EX: relações semânticas entre os objetos (matriz de similaridade) Refere-se ao processo que transforma dados abstratos e “invisíveis” e seus relacionamentos em uma coleção de dados visualizados. Visualização provê navegação aos usuários Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

12 Processo de Visualização em RI
Esse processo de tratamento, recuperação e disseminação de informação pode ser comparado com o processo pelo qual Visualização de Informação procura alguns diagramas representativos do processo de Visualização de Informação [Card et Este processo está representado no diagrama da Figura 1, obtido pela sumarização de transformar em uma representação gráfica e interativa um conjunto de dados brutos. Nessa figura, um indivíduo possui em mente a tarefa de estudar uma situação al. 1999; Ware 2004; Spence 2001]. necessárias. A coleta desses dados pode ser feita por sistemas computacionais, por coletar dados sobre essa situação, a partir dos quais se deseja obter as informações particular e obter informações relevantes sobre ela. Para tanto, é necessário inicialmente diferentes dispositivos como sensores e câmeras, ou manualmente pelo próprio arquivos diversos, endereços de sites da Internet, entre outros. Diferentes entidades, medidas, quantidades, códigos, descrições, coordenadas espaciais, imagens, vídeos, indivíduo. O conjunto de dados brutos coletados pode ser heterogêneo, contendo datas, Dada essa multiplicidade e heterogeneidade de dados, recuperar informação atributos e relacionamentos podem estar representados nesse conjunto de dados. características e dos relacionamentos entre diferentes entidades. Esta tarefa de possa ser obtida pela consulta e comparação de entidades similares, de suas exige primeiramente a tarefa de organizar esses dados, de forma que alguma informação tratamento de dados envolve organizar esses dados em estruturas (ou tabelas), e é pois a organização do próprio banco de dados pode ser utilizada. Por outro lado, há tratados estão armazenados em um SGBD, essa transformação pode ser desnecessária, denominada transformação de dados [Card et al. 1999]. Quando os dados a serem muitos dados dispersos e sem relacionamento aparente (como pode ocorrer na coleta casos em que essas transformações são necessárias, pois a situação estudada apresenta indivíduo obtenha informações relevantes sobre a situação estudada. Nesses casos, Esse primeiro nível de organização de dados pode não ser suficiente para que o manual de dados), exigindo organização para ser mais bem compreendido. que podem ser aplicadas sobre as estruturas de dados obtidas. Essas novas ordenação, cálculo de médias e classificação de características são algumas operações dados coletado [Card et al. 1999]. Algoritmos de recuperação de informação, como os características semelhantes, possibilitando a sumarização e abstração do conjunto de transformações de dados permitem classificar e agregar entidades que compartilham podem ser usados para, a partir dos dados brutos, extrair dados que sejam mais utilizados para cálculo de similaridades entre imagens [Torres et al. 2003], também conjunto de dados disponível pode ser ainda suficientemente grande (em quantidade de Mesmo após diferentes operações de classificação e de agregação de dados, o relevantes com relação à tarefa de análise. dados e em número de dimensões) para se conseguir obter informação relevante. Isso detalhado, serial, lento e de baixa capacidade de dados. processamento visual controlado [Card et al. 1999] desses dados, um processo que é acontece porque a representação de dados em formato textual exige que se faça um Interações Informações representadas Dados brutos estudo Situação sob Pessoa Coleta exibição Dispositivo de dados de Controles interativos de Dados Estruturas Transformações Visuais transformações de visão Mapeamento visual e de dados cognição visão • Relações visuais • Mapa cognitivo • Tarefa • Abstrações • Inferências 2072 • Etc. • Padrões visão, em um processo mais superficial, paralelo (no sentido de obter várias graficamente, por outro lado, tendem a ser processadas de maneira mais automática pela informações simultaneamente), rápido e de capacidade elevada.

13 Processo de Visualização em RI
Dados brutos: dados coletados sobre a situação a ser estudada, a partir dos quais se deseja obter as informações A coleta pode ser feita por : sistemas computacionais Por diferentes dispositivos como sensores e câmeras manualmente pelo próprio indivíduo.

14 Processo de Visualização em RI
O conjunto de dados brutos coletados pode ser heterogêneo, contendo: datas, medidas, quantidades, códigos, descrições, coordenadas espaciais, imagens, vídeos, arquivos diversos, endereços de sites da Internet, entre outros. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

15 Geração do processo de Visualização
Transformação dos dados: Tratamento dos dados coletados Dados coletados podem estar dispersos e sem relacionamento aparente Organização do dados coletados de forma a oferecer possibilidade de obter informação informação obtida através de consulta e comparação de entidades similares, de suas características e dos relacionamentos entre diferentes entidades Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

16 Geração do processo de Visualização
Transformação dos dados: ordenação, cálculo de médias e classificação de características são algumas operações que podem ser aplicadas sobre as estruturas de dados obtidas. permitem classificar e agregar entidades que compartilham características semelhantes, possibilitando a sumarização e abstração do conjunto de dados coletado Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

17 Geração do processo de Visualização
Estruturas visuais: Mapeamento visual Definição do modo como as estruturas de dados são transformadas em estruturas visuais Leva em conta quais as características dos dados a serem representados, das propriedades visuais que podem ser usadas para representar esses dados interface humano-computador envolvida no processo (no caso, a tela de exibição dos dados e os dispositivos de recebimento de interações do usuário), visão e cognição humana Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

18 Geração do processo de Visualização
Estruturas visuais: O mapeamento visual dos dados estabelece como cada atributo será representado, ou seja, quais propriedades gráficas e espaciais podem ser utilizadas para sua representação. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

19 Geração do processo de Visualização
Estruturas visuais: Propriedades gráficas Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

20 Geração do processo de Visualização
Técnicas de visualização ou espacialização dos dados: Qual técnica de visualização deve ser empregada? Dependente do tipo de informação Técnicas podem ser: Unidimensionais (1D) Temporais Qual técnica de visualização deve ser empregada? dependente do tipo de informação técnicas de visualização por tipo de dados e por tarefas: técnicas podem ser unidimensionais (1D), temporais, bidimensionais (2D), tridimensionais (3D) e multidimensionais (nD), dirigidas à visualização de hierarquias e de relacionamentos (grafos), e podem su'portar tarefas como a obtenção de uma visão geral, obtenção de visão detalhada, zooming, filtragem, identificação de relacionamentos, manutenção de histórico de ações e extração de informações diversas. Chi e Riedl [8], num trabalho de formalização do processo de visualização, partem de tipos de dados e de operadores que são inerentes a cada técnica de visualização para criar uma abordagem unificada ao enquadramento das técnica Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

21 Geração do processo de Visualização
Técnicas podem ser:  Bidimensionais (2D) Tridimensionais (3D) Multidimensionais (nD) (Uso de PCA para reduzir dimensões), Dirigidas à visualização de hierarquias e de relacionamentos (grafos), Obtenção de uma visão geral, visão detalhada (zooming, filtragem) identificação de relacionamentos Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

22 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Exemplo 1 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

23 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Exemplo 2 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

24 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Resumidamente, as técnicas de visualização de informações procuram representar graficamente dados de um determinado domínio de aplicação de modo que a representação visual gerada explore a capacidade de percepção do homem e este, a partir das relações espaciais exibidas, interprete e compreenda as informações apresentadas e, finalmente,deduza novos conhecimentos. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

25 Problema na Visualização
Grande volume de informação e/ou representação ininteligível necessário reduzir a informação a visualizar simplificação da representação Pode eliminar alguma da informação sobre o conjunto de dados. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

26 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
REDUÇÃO DE DIMENSÃO Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

27 Projection Explorer - PEX
Pex é uma ferramenta construída em Java que pode ser utilizada para criar e explorar representações visuais de coleções de documentos, ajudando o usuário a analisar seus conteúdos. PEx pode ser dividido em quatro etapas principais: pré-processamento, cálculo da matriz de distâncias, projeção apresentação/interação com usuário. Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

28 Ferramenta PEx (Projection Explorer)
Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio

29 Projection Explorer Projection Explorer (version 1.6.1)
Java based tool... Objetivo - Usada para criar e explorar representações visuais de coleções de documentos. Projection Explorer (version 1.6.1) University of São Paulo (USP), São Carlos/SP, Brazil Matemathical and Computer Science Institute (ICMC) Computer Graphics and Image Processing Group

30 PEx – Tipos suportados Dados estruturados (tabelas) – pontos de dados com atributos numéricos e “labels”. Distância de dados – matrizes triangulares cujos elementos descrevem valores de similaridade entre pontos de dados. Conjuntos de dados texto. Resultados de pesquisas na web.

31 PEx – Características de Visualização
Projeta os itens de dados como pontos num espaço 2D de saída. Todo ponto representa um item de dado. A proximidade dos pontos indica a relação de similaridade, de acordo com as medidas escolhidas.

32 PEx – Características de Visualização
Labels são mostrados no topo dos nós. Permite realizar pesquisas e os nós são coloridos de acordo com a freqüência de ocorrência do termo. Detecta e exibe automaticamente tópicos sobre grupos de documentos. Ferramentas para explorar o gráfico de visualização de dados estão disponíveis.

33 PEx – Características de Visualização
Diferentes relacionamentos entre “vizinhos” podem ser exibidos como arestas entre os nós, ajudando a exploração de similaridade. Objetivo: Representação de similaridade Método de triangulação de Delaunay Método KNN (K Nearest Neighbors Método KNN (K Nearest Neighbors

34 PEx – Características de Exploração
Cada ponto é exibido como um círculo, usualmente chamado de “nó”. Conexões entre os nós são exibidas para mostrar alguma ordem de relação entre os pontos de dados, formando gráficos ou uma triangulação.

35 PEx – Processo de Projeção
O usuário pode iniciar a projeção com: Uma coleção de documentos (1) Uma tabela de dados estruturados, Points File (2) Uma matriz de distâncias (3) Na primeira opção documentos são convertidos numa representação de vetor. Na segunda opção as distâncias são calculadas diretamente do Points File. Na terceira opção a matriz de distâncias é inserida diretamente. A partir de relacionamentos de distâncias a projeção 2D é gerada.

36 PEx – Processamento do Corpus
Técnicas de projeção disponíveis: PCA (Principal Component Analysis) IDMAP (Interactive Document Map) LSP (Least Square Projection) ProjClus (Projection by Clustering) ISOMAP (Isometric Feature Mapping) Entre outras.

37 PEx – Processamento do Corpus
Tipos de distância disponíveis: Euclidiana city block (Manhatan) Baseada em co-seno Extended Jaccard Infinity Norm

38 PEx – Processamento do Corpus
Redução do espaço vetorial: Stemming Redução de termos ao radical. Stopwords Redução de termos através de lista de palavras. Luhn Também conhecido como “cortes de Luhn” Redução de termos pela sua freqüência. Startwords

39 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio
Referências Silva, C. G. Considerações sobre o uso de Visualização de Informação no auxílio à gestão de informação J. Zhang. Visualization for Information Retrieval, University of Visconsin, School of Information Studies. Freitas C., Chubachi O., Luzzardi P., Cava R., Introdução à Visualização de Informações. Site: Paulovich F., Oliveira M., Minghin R., The Projection Explorer: A flexible tool for projection-based multidimensional visualization, Universidade de São Paulo. Carla Freitas; Olinda Mioka Chubachi1,2 Paulo Roberto Gomes Luzzardi1,3 Ricardo Andrade Cava1,3,4 Recuperação de Informação Prof.: Flávia Barros/Ricardo Prudêncio


Carregar ppt "Visualização da Informação"

Apresentações semelhantes


Anúncios Google