A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:

Apresentações semelhantes


Apresentação em tema: "Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:"— Transcrição da apresentação:

1 Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa: Redes de Computadores

2 Introdução Objetivos Proposta para avaliação comportamental Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros Estrutura

3 Foco da pesquisa: Avaliação comportamental. Contexto em que avaliação comportamental é pesquisada: mecanismo de segurança para aplicações Web baseado em confiança (idéia básica >conceito de confiança>medida de confiança). finalidade do mecanismo: despender menos tempo para comprovar a identificação. Introdução

4 Objetivos Proposta para avaliação comportamental Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros Estrutura

5 Objetivos Construção do web site experimental como gerador de subsídios para avaliação comportamental. Investigação de novas técnicas passíveis de serem empregadas para quantificar a confiança. Esclarecimentos: comportamento informações de uso (trilha, dados temporais...) trilha de navegação = instância comportamental assinatura conjunto de instâncias do mesmo indivíduo histórico comportamental conjunto de comportamentos do mesmo indivíduo

6 Introdução Objetivos Proposta para avaliação comportamental Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros Estrutura

7 Coleta das assinaturas Formulação do problema: tarefa de aprendizagem. Modelo simplificado de aprendizagem baseado em instâncias (Instance-Based Learning - IBL): Conceito IBL Classificação da instância Representação da instância Geração das instâncias: por meio de um experimento com diferentes usuários.

8 Aspectos da construção de web sites Convenções. Aspectos observados: maneira de associar as instâncias aos seus respectivos usuários; delimitação do início e término de uma instância comportamental; delimitação de um macro-estado; captura do comportamento com o uso do navegador.

9 Cálculo da Confiança SComp: Similaridade comparativa –Similitude entre a instância atual e o conjunto de instâncias que compõe a assinatura –Espelha o quanto este comportamento se aproxima dos demais previamente capturados SIntra: Intra-similaridade –Independente da amostra atual de instância comportamental –Qualidade da assinatura do usuário –Representa se um usuário possui um comportamento bem formado SInter: Inter-similaridade –Qualidade da assinatura de um usuário em função do conjunto completo de assinaturas (de diferentes usuários) Trust M = SComp M *SIntra M *SInter M

10 Cadeias de Markov Condição inicial: as páginas do web site são os estados da cadeia de Markov e os links as transições que envolvem os estados. Seja a ij a probabilidade de transição do estado i para o estado j, então a matriz 3 x 3 é a seguinte: a ij = número de vezes que houve transição do estado i para o estado j / número de ocorrências do estado i na assinatura.Ex.: 1 # 2 # 3 SComp: Cálculo da Confiança

11 Distância de Levenshtein Aplica-se o algoritmo para o cálculo da Distância de Levenshtein; Ex.: Principal#PopNacional#RockNacional#Detalhes#ConcluirVenda# Principal#RockNacional#Detalhes#ConcluirVenda# Realiza-se a normalização pelo valor máximo das distâncias; Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de trilhas da assinatura); Quanto menor a distância maior a similaridade entre as trilha. SIntra: 1 - Cálculo da Confiança

12 Distância de Frobenius Condição inicial: cada histórico de navegação é representado por uma matriz de transição de probabilidade de Markov. Calcula-se a Distância de Frobenius entre a matriz do usuário e as demais matrizes existentes. Ex.: Realiza-se a normalização pelo valor máximo das distâncias; Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de distâncias). SInter : é a média das distâncias de Frobenius Cálculo da Confiança

13 Introdução Objetivos Proposta para avaliação comportamental Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros Estrutura

14 Metodologia 1ª etapa: definição do contexto do experimento. 2ª etapa: projeto e implementação do web site Linguagem: HTML e PHP. Agentes de software: coletam os comportamento 3ª etapa: testes com o experimento Dois testes on-line com um grupo de pessoas que receberam as instruções de acesso à loja. Foram gerados pelos participantes 21 históricos e 179 instâncias comportamentais. 4ª etapa: aplicação das técnicas para obter a medida de confiança para cada usuário. 5ª etapa: definição do limiar de confiança

15

16

17 Resultados e análise Os valores considerados para o Trust são os resultados da aplicação da Distância de Levenshtein para SComp e SIntra e Frobenius para SInter.

18 Resultados e análise Observações: o IP de fato não identifica o usuário com precisão; falta de permissão para a utilização do Cookie; problemas de condução foram verificados no ambiente estruturado inicialmente na forma de um grafo fortemente conexo; a alteração da estrutura do site por uma estrutura mais condutora, não comprometeu a liberdade de navegação dos participantes (contingente de páginas alteradas foram aquelas de acesso comum a todos os participantes); o monitoramento dos eventos das páginas permitiu coletar os comportamentos mesmo em situações onde o navegador era utilizado ou quando várias páginas eram mantidas em aberto.

19 Resultados e análise A medida de similaridade dada por Markov considera a ordem de aparecimento das páginas na trilha e a similaridade máxima entre elas. Ao contrário, a Distância de Levenshtein considera a parcialidade de similaridade entre trilhas. Por este motivo optou-se pela abordagem de Levenshtein também para SComp. Os valores apresentados pela aplicação de Markov são resultados da estratégia de se associar um valor mínimo (10 -4 ) de probabilidade a uma transição inexistente no histórico. Observou-se uma outra característica de diferenciação comportamental: a diferenciação pelo tamanho da trilhas de navegação.

20 Resultados e análise Limiar de confiança: patamar de aceitação mínimo para cada usuário. Estratégia utilizada: a cada vez uma instância é teste e as outras treinamento. A quantidade de valores do Trust são tantos quantos forem as instâncias da assinatura. O thresold são valores entre 0:0,001:1. Ex.: O melhor thresold é um valor para qual a soma do erro do Tipo I e erro do Tipo II é mínima.

21 Introdução Objetivos Proposta para avaliação comportamental Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros Estrutura

22 Conclusões e trabalhos futuros Descreve uma proposta de construção de um web site experimental como gerador de subsídios para a avaliação comportamental e a investigação de técnicas de reconhecimentos de padrões para quantificar os fatores de confiança. Destaca-se a proposta de utilização de agentes de software para formação dos históricos comportamentais e resolução de problemas conhecidos. A linguagem de programação usada no desenvolvimento dos agentes permite ainda que o mecanismo seja reutilizado em outros ambientes. No entanto a utilização de Cookies é o fator limitante ao desempenho do mecanismo.

23 Conclusões e trabalhos futuros Outra importante contribuição é o procedimento proposto para quantificar os fatores de confiança. Abordagens foram investigadas e aplicadas ao cálculo de confiança. O valor mínimo de confiança foi estabelecido para cada usuário. Trabalhos em andamento incluem: a definição de um conjunto de diretrizes e a definição de quando a avaliação comportamental pode ser utilizada.

24 Perguntas?


Carregar ppt "Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa:"

Apresentações semelhantes


Anúncios Google