A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

PAGE RANK Duílio Assis Nobre

Apresentações semelhantes


Apresentação em tema: "PAGE RANK Duílio Assis Nobre"— Transcrição da apresentação:

1 PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

2 SUMÁRIO Introdução a Processos Estocásticos - Definição e exemplos Cadeias de Markov - Definição e exemplos - Probabilidade de Transição - Probabilidades Estacionárias Aplicação na área de computação: Page Rank Referências

3 INTRODUÇÃO A PROCESSOS ESTOCÁSTICOS Definição Exemplos: - X(t) representa o número de clientes numa loja no instante t; - X(t) representa a cotação de uma ação no fim do dia t; - X(t) representa o nível de stock de um determinado artigo no fim do dia t;

4 CADEIAS DE MARKOV Definição

5 CADEIAS DE MARKOV Considere o seguinte exemplo: - Para cada pessoa que compre licor da família F há 90% de probabilidade de o próximo licor que comprar seja licor Florescente. - Já para cada pessoa que compre o licor da família P há só 80% de o próximo comprado seja ainda o licor Petalado.

6 CADEIAS DE MARKOV Matriz de transição de estados: Outra forma de representação, diagrama de tansições:

7 CADEIAS DE MARKOV Portanto a probabilidade de transição em n passos é dada por: Probabilidade de Transição:

8 CADEIAS DE MARKOV Matriz de transição para 3 passos: Visto isso, podemos dizer que se P for uma matriz estocástica, então qualquer potência de P o é, pois:

9 CADEIAS DE MARKOV Probabilidades Estacionárias: - Probabilidades de transição em dezesseis períodos: A esta probabilidade chama-se probabilidade estacionária do estado j e representa- se por ח j. Por outras palavras,

10 CADEIAS DE MARKOV - Corresponde a um sistema de equações de solução indeterminada:

11 CADEIAS DE MARKOV Relembrando o primeiro exemplo, quais são as probabilidades estacionárias? O que significam estes valores?

12 PAGE RANK Motivação: - Dexar claro o que é Page Rank e sua importância - Mostrar como o é calculado para cada página

13 PAGE RANK

14 A formula: PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) - PR(Tn ): Importância de cada página - C(Tn): Número de links saindo de cada página - d e (1-d): valores de Teleporting

15 PAGE RANK Teleporting: - Uma caminha aleatória. - Uma caminha aleatoria normal.

16 PAGE RANK Exemplo 1: Pelo gráfico temos que C(A) = 1 e C(B) = 1 Certo, mas quais valores iniciais de PR(A) e PR(B)? d= 0.85 PR(A)= (1 – d) + d(PR(B)/1) PR(B)= (1 – d) + d(PR(A)/1)

17 PAGE RANK PR(A) = 0.15 + 0.85 * 1/1 = 1 PR(B) = 0.15 + 0.85 * 1/1 = 1 Vamos começar com ambos iguais a 1: Agora, vamos considerar ambos inicialmente iguais a 0: PR(A) = 0.15 + 0.85 * 0.2775 = 0.385875 PR(B) = 0.15 + 0.85 * 0.385875 = 0.47799375 PR(A) = 0.15 + 0.85 * 0/1 = 0.15 PR(B) = 0.15 + 0.85 * 0.15/1 = 0.2775 Repetindo as contas:

18 PAGE RANK PR(A) = 0.15 + 0.85 * 40/1 = 34.15 PR(B) = 0.15 + 0.85 * 34.15/1 = 29.1775 Agora, vamos considerar ambos inicialmente iguais a 40: Repetindo as contas: PR(A) = 0.15 + 0.85 * 29.1775/1 = 24.950875 PR(B) = 0.15 + 0.85 * 24.950875/1 = 21.35824375

19 PAGE RANK Começando com ambos 0, vamos fazer um número considerável de interações. Abaixo segue apenas os resultados: PR(A): 0.00000 PR(B): 0.00000 PR(A): 0.15000 PR(B): 0.27750 PR(A): 0.38588 PR(B): 0.47799 PR(A): 0.55629 PR(B): 0.62285 PR(A): 0.67942 PR(B): 0.72751 PR(A): 0.76838 PR(B): 0.80313 PR(A): 0.83266 PR(B): 0.85776 PR(A): 0.87909 PR(B): 0.89723 PR(A): 0.91265 PR(B): 0.92575 PR(A): 0.93689 PR(B): 0.94635 PR(A): 0.95440 PR(B): 0.96124 PR(A): 0.96705 PR(B): 0.97200 PR(A): 0.97620 PR(B): 0.97977 PR(A): 0.98280 PR(B): 0.98538 PR(A): 0.98757 PR(B): 0.98944 PR(A): 0.99102 PR(B): 0.99237 PR(A): 0.99351 PR(B): 0.99449 PR(A): 0.99531 PR(B): 0.99602 PR(A): 0.99661 PR(B): 0.99712 PR(A): 0.99755 PR(B): 0.99792 Visto os resultados das 3 suposições de valores iniciais a PR(A) e PR(B), a que conclusão podemos chegar?

20 PAGE RANK Exemplo 2: Exemplo 3:

21 PAGE RANK Quais seriam os PRs das páginas do exemplo 3? PR(A) = (1-d) + d (PR(B)/C(B) + … + PR(Spam n)/C(Spam n)) Pegando todos os 1000 spams e isolando temos: PR(A) = (1-d) + d (PR(B)/C(B) + 1000(PR Spam) /C(Spam )) Qual seria o efeito desse fator 1000 no cálculo do PR(A) e PR(B)? Fazendo algumas contas, temos: PR(A): 0.00000 PR(B): 0.00000 PR(Spams): 0.00000 PR(A): 0.15000 PR(B): 0.27750 PR(Spams): 0.15024 PR(A): 127.85049 PR(B): 108.82292 PR(Spams): 0.24250 PR(A): 206.27456 PR(B): 175.48338 PR(Spams): 0.29916

22 PAGE RANK

23 Qual seria a sua importância de um modo geral? O que seria um possível defeito?

24

25

26

27 REFERÊNCIAS http://www.ianrogers.net/google-page-rank/ http://www.youtube.com/watch?v=FNjQ- itLuBY&feature=related http://www.youtube.com/watch?v=FNjQ- itLuBY&feature=related - Chave de busca no YouTube: Como funciona el algoritmo PageRank de Google

28 PAGE RANK Duílio Assis Nobre duilioanss@gmail.com


Carregar ppt "PAGE RANK Duílio Assis Nobre"

Apresentações semelhantes


Anúncios Google