A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.

Apresentações semelhantes


Apresentação em tema: "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG."— Transcrição da apresentação:

1 Marcus Sampaio DSC/UFCG

2 Marcus Sampaio DSC/UFCG

3 Marcus Sampaio DSC/UFCG Um Problema para Você Resolver Análise de Impacto de Mudança de Software –Seja o grafo de dependência entre classes de software

4 Marcus Sampaio DSC/UFCG M = {A, B, C}, o conjunto das classes de mudança, constituído pelas classes que não são terminais do grafo de dependência I = {E, F}, o conjunto das classes impactadas, constituído pelas classes terminais do grafo de dependência M  I =  –A interpretação: se algumas classes pertencentes a M mudarem (validarem), então algumas classes pertencentes a I também mudam (validam)

5 Marcus Sampaio DSC/UFCG Um Problema...: Histórico de Mudanças ABCEFTotal

6 Marcus Sampaio DSC/UFCG 1-) Qual é a probabilidade de E mudar, se A e B mudarem? 2-) Qual é a probabilidade de A mudar, independentemente de mudanças das outras classes? 3-) Se A mudar, qual a probabilidade de C ou E ou F também mudarem? 4-) Qual é a confiabilidade dos resultados?

7 Marcus Sampaio DSC/UFCG Teoria de Probabilidade Probabilidade Condicional –Qual a probabilidade de Y acontecer, dada a probabilidade de X acontecer? –P(Y | X) = P(XY) / P(X) –Exercício 5-): Resolva o exercício 1-) em termos de probabilidade condicional

8 Marcus Sampaio DSC/UFCG Lei da Probabilidade Total –Seja A 1,..., A k uma partição de um conjunto de eventos (um histórico) A 1 ...  A k =  –Seja B um evento qualquer –P(B) =  i=1,k P(B | A i )P(A i ) –Exercício 6-): Resolva o exercício 2-) em termos da lei da probabilidade total

9 Marcus Sampaio DSC/UFCG Teorema de Bayes –Seja A 1,..., A k uma partição, com P(Ai) > 0 –Se P(B) > 0 –P(A i | B) = P(B | A i ) P(A i ) /  j P(B | A j )P(A j ) –Exercício 7-): Resolva o exercício 3-) em termos do teorema de Bayes

10 Marcus Sampaio DSC/UFCG Qual é o Problema Básico da Teoria da Probabilidade? O problema básico da Teoria da Probabilidade é Dado um processo de geração de dados  por exemplo, o processo de manutenção de um software  quais são as propriedades dos dados observados?

11 Marcus Sampaio DSC/UFCG

12 Marcus Sampaio DSC/UFCG Qual é o Problema Básico da Mineração de Dados? O problema básico da Mineração de Dados (“Data Mining”) é o inverso da probabilidade Dados os resultados, o que podemos induzir ou inferir sobre o processo que gerou os dados? Voltando ao grafo de dependência de classes de software do slide 3, um algoritmo de mineração de dados (MD) poderia induzir a seguinte regra de associação –Se A e B mudam então E também muda, com suporte igual a 2 e confiança (c) igual a 67%

13 Marcus Sampaio DSC/UFCG Formalmente –AB  E, sup=2 c=67% –O suporte é o número de vezes que A, B e E mudaram juntas –A confiança mede a associação entre AB e E, ou seja, nas tantas vezes em que A e B mudaram, quantas vezes E também mudou c = sup(ABE) / sup(AB) = 2 / 3 = 67% (veja a tabela do slide 5) –Note que esta confiança não é ‘confiável’ porque o suporte da regra é muito baixo

14 Marcus Sampaio DSC/UFCG MD & Probabilidade Data generating process Observed data Probability Data Mining Fonte: All of Statistics, Larry Wasserman

15 Marcus Sampaio DSC/UFCG Regra de Associação e Probabilidade Condicional –No que segue, X representa um conjunto de itens quaisquer (classe de software é um exemplo de item) –Seja a regra de associação X  Y, c = sup(XY) / sup(X) Interpretação probabilística: Qual a probabilidade de Y acontecer dada a probabilidade de X acontecer? –P(Y | X) = P(XY) / P(X) = (sup(XY) / Universo) / (sup(X / Universo) = sup(XY) / sup(X) = c

16 Marcus Sampaio DSC/UFCG Conclusões De tudo o que foi exposto, pode-se concluir que mineração de dados e probabilidade estão ligadas umbilicalmente, ou que são as duas faces de uma mesma moeda No fundo, algoritmos de mineração de dados induzem conhecimento  regra de associação é um dos inúmeros modelos de conhecimento  implementando convenientemente modelos probabilísticos, entre outras disciplinas –Abordagem bem diferente da inteligência artificial, que é baseada em lógica matemática


Carregar ppt "Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG."

Apresentações semelhantes


Anúncios Google