A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Área de Pesquisa: Redes de Computadores

Apresentações semelhantes


Apresentação em tema: "Área de Pesquisa: Redes de Computadores"— Transcrição da apresentação:

1 Área de Pesquisa: Redes de Computadores
Reconhecimento de padrões de comportamento individual baseado no histórico de navegação em um Web Site Danielle Costa Luiz Fernando Rust Área de Pesquisa: Redes de Computadores SBSEG 2007

2 Estrutura Introdução Objetivos Proposta para avaliação comportamental
Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros

3 Introdução Foco da pesquisa: Avaliação comportamental.
Contexto em que avaliação comportamental é pesquisada: mecanismo de segurança para aplicações Web baseado em confiança (idéia básica >conceito de confiança>medida de confiança). finalidade do mecanismo: despender menos tempo para comprovar a identificação.

4 Estrutura Introdução Objetivos Proposta para avaliação comportamental
Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros

5 Objetivos Construção do web site experimental como gerador de subsídios para avaliação comportamental. Investigação de novas técnicas passíveis de serem empregadas para quantificar a confiança. Esclarecimentos: comportamento  informações de uso (trilha, dados temporais...) trilha de navegação = instância comportamental assinatura  conjunto de instâncias do mesmo indivíduo histórico comportamental  conjunto de comportamentos do mesmo indivíduo

6 Estrutura Introdução Objetivos Proposta para avaliação comportamental
Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros

7 Coleta das assinaturas
Formulação do problema: tarefa de aprendizagem. Modelo simplificado de aprendizagem baseado em instâncias (Instance-Based Learning - IBL): Conceito IBL Classificação da instância Representação da instância Geração das instâncias: por meio de um experimento com diferentes usuários.

8 Aspectos da construção de web sites
Convenções. Aspectos observados: maneira de associar as instâncias aos seus respectivos usuários; delimitação do início e término de uma instância comportamental; delimitação de um macro-estado; captura do comportamento com o uso do navegador.

9 TrustM = SCompM*SIntraM*SInterM
Cálculo da Confiança TrustM = SCompM*SIntraM*SInterM SComp: Similaridade comparativa Similitude entre a instância atual e o conjunto de instâncias que compõe a assinatura Espelha o quanto este comportamento se aproxima dos demais previamente capturados SIntra: Intra-similaridade Independente da amostra atual de instância comportamental Qualidade da assinatura do usuário Representa se um usuário possui um comportamento bem formado SInter: Inter-similaridade Qualidade da assinatura de um usuário em função do conjunto completo de assinaturas (de diferentes usuários)

10 Cálculo da Confiança Cadeias de Markov
Condição inicial: as páginas do web site são os estados da cadeia de Markov e os links as transições que envolvem os estados. Seja aij a probabilidade de transição do estado i para o estado j, então a matriz 3 x 3 é a seguinte: aij= número de vezes que houve transição do estado i para o estado j / número de ocorrências do estado i na assinatura.Ex.: 1 # 2 # 3 SComp:

11 Cálculo da Confiança Distância de Levenshtein
Aplica-se o algoritmo para o cálculo da Distância de Levenshtein; Ex.: Principal#PopNacional#RockNacional#Detalhes#ConcluirVenda# Principal#RockNacional#Detalhes#ConcluirVenda# Realiza-se a normalização pelo valor máximo das distâncias; Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de trilhas da assinatura); Quanto menor a distância maior a similaridade entre as trilha SIntra: 1 -

12 Cálculo da Confiança Distância de Frobenius
Condição inicial: cada histórico de navegação é representado por uma matriz de transição de probabilidade de Markov. Calcula-se a Distância de Frobenius entre a matriz do usuário e as demais matrizes existentes. Ex.: Realiza-se a normalização pelo valor máximo das distâncias; Calcula-se a média das distâncias: (soma das distâncias normalizadas)/(quantidade de distâncias).         SInter : é a média das distâncias de Frobenius

13 Estrutura Introdução Objetivos Proposta para avaliação comportamental
Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros

14 Metodologia 1ª etapa: definição do contexto do experimento.
2ª etapa: projeto e implementação do web site Linguagem: HTML e PHP. Agentes de software: coletam os comportamento 3ª etapa: testes com o experimento Dois testes on-line com um grupo de pessoas que receberam as instruções de acesso à loja. Foram gerados pelos participantes 21 históricos e 179 instâncias comportamentais. 4ª etapa: aplicação das técnicas para obter a medida de confiança para cada usuário. 5ª etapa: definição do limiar de confiança

15

16

17 Resultados e análise Os valores considerados para o Trust são os resultados da aplicação da Distância de Levenshtein para SComp e SIntra e Frobenius para SInter.

18 Resultados e análise Observações:
o IP de fato não identifica o usuário com precisão; falta de permissão para a utilização do Cookie; problemas de condução foram verificados no ambiente estruturado inicialmente na forma de um grafo fortemente conexo; a alteração da estrutura do site por uma estrutura mais condutora, não comprometeu a liberdade de navegação dos participantes (contingente de páginas alteradas foram aquelas de acesso comum a todos os participantes); o monitoramento dos eventos das páginas permitiu coletar os comportamentos mesmo em situações onde o navegador era utilizado ou quando várias páginas eram mantidas em aberto.

19 Resultados e análise A medida de similaridade dada por Markov considera a ordem de aparecimento das páginas na trilha e a similaridade máxima entre elas. Ao contrário, a Distância de Levenshtein considera a parcialidade de similaridade entre trilhas. Por este motivo optou-se pela abordagem de Levenshtein também para SComp. Os valores apresentados pela aplicação de Markov são resultados da estratégia de se associar um valor mínimo (10-4) de probabilidade a uma transição inexistente no histórico. Observou-se uma outra característica de diferenciação comportamental: a diferenciação pelo tamanho da trilhas de navegação.  

20 Resultados e análise Limiar de confiança: patamar de aceitação mínimo para cada usuário. Estratégia utilizada: a cada vez uma instância é teste e as outras treinamento. A quantidade de valores do Trust são tantos quantos forem as instâncias da assinatura. O thresold são valores entre 0:0,001:1. Ex.: O melhor thresold é um valor para qual a soma do erro do Tipo I e erro do Tipo II é mínima.

21 Estrutura Introdução Objetivos Proposta para avaliação comportamental
Coleta da assinatura Aspectos da construção de web sites Cálculo da confiança Avaliação experimental Metodologia Resultados e análise Conclusões e trabalhos futuros

22 Conclusões e trabalhos futuros
Descreve uma proposta de construção de um web site experimental como gerador de subsídios para a avaliação comportamental e a investigação de técnicas de reconhecimentos de padrões para quantificar os fatores de confiança. Destaca-se a proposta de utilização de agentes de software para formação dos históricos comportamentais e resolução de problemas conhecidos. A linguagem de programação usada no desenvolvimento dos agentes permite ainda que o mecanismo seja reutilizado em outros ambientes. No entanto a utilização de Cookies é o fator limitante ao desempenho do mecanismo.

23 Conclusões e trabalhos futuros
Outra importante contribuição é o procedimento proposto para quantificar os fatores de confiança. Abordagens foram investigadas e aplicadas ao cálculo de confiança. O valor mínimo de confiança foi estabelecido para cada usuário. Trabalhos em andamento incluem: a definição de um conjunto de diretrizes e a definição de quando a avaliação comportamental pode ser utilizada.

24 Perguntas?


Carregar ppt "Área de Pesquisa: Redes de Computadores"

Apresentações semelhantes


Anúncios Google