Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.

Slides:



Advertisements
Apresentações semelhantes
Árvores CC/EC/Mestrado Teoria dos Grafos ‏ 1.
Advertisements

INTELIGÊNGIA COMPUTACIONAL
Teoria da Computação EQUIVALÊNCIA DE PROGRAMAS E MÁQUINA Fabrício Dias
A EXPLICAÇÃO CAUSAL MARIA DAS GRAÇAS RUA
Prática de Alg. Genéticos
LÓGICA MATEMÁTICA IMPLICAÇÃO LÓGICA
Representação do Conhecimento e Raciocínio
Uma das tarefas descritivas da
Modelos de Preferências AULA 15 DATA MINING Sandra de Amo.
Datalog Recursivo AULA 6 PGC Sistemas de Banco de Dados
INE Fundamentos de Matemática Discreta para a Computação
Estatística Aula 11 Prof. Marllus Gustavo Ferreira Passos das Neves
Matemática Discreta I BCC101
APRENDIZAGEM COM CONHECIMENTO A PRIORI
CLOSET: An Efficient Algorithm for Mining Frequent Closed Itemsets Jian Pei, Jiawei Han e Runying Mao Apresentação preparada por Alexandre Lorenzatti.
Redes Bayesianas Alexandre Silva Pinheiro
Prof. MSc Sofia Mara de Souza AULA3
Instituto Tecnológico da Aeronáutica – ITA Divisão de Ciência de Engenharia Eletrônica e Computação EE-09 Inteligência Artificial Prof. Adilson Marques.
G R U P O S - II.
ESTRUTURAS ALGÉBRICAS
II. M o d e l o s d e C o n h e c i m e n t o
3. Árvore de Decisão.
Data Mining como ferramenta de Gestão
CAPÍTULO I- TEORIA DAS PROBABILIDADE
MATEMÁTICA Prof. Carlos Alexandre.
SQL Server 2012 Introdução a Modelagem de Dados
Análise e Projeto de Sistemas de Informação Orientados a Objeto
Matemática Discreta I BCC101
AXIOMÁTICA Rosa Canelas.
AXIOMÁTICA.
Independência Estatística
Informática Teórica Engenharia da Computação
MICROCOMPAN Y CONTABILIDADE Dúvidas:
BI - Conceito É o conjunto de conceitos e metodologias que, fazendo uso de acontecimentos (fatos) e sistemas baseados nos mesmos, apóia a tomada de decisões.
Engenharia de Software
Independência Estatística
Uma Abordagem Híbrida Fuzzy-Bayesiana para Modelagem de Incertezas
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Matemática Discreta I BCC101 Introdução. 2 Bibliografia, Slides, Exercícios etc Bibliografia: Richard Hammack: Book of Proof Velemann: How to Prove it.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Matemática e suas Tecnologias - Matemática PROBABILIDADE CONDICIONAL
2. Visão Geral de MD Alguns slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
Estatística Geral (Elementos de Probabilidade)
Probabilidade e Mineração de Dados
13/11/2007 João Arthur Brunet Monteiro GMF/DSC/CEEI/UFCG Evolução de Software A Survey of Software Refactoring Reconstruction of Successful Software Evolution.
7. Mineração de Texto ("Text Mining")
PROBABILIDADE UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG O Problema Dados –Um banco de transações de compra –Cada transação é um conjunto de ítens comprados Encontrar.
Raciocínio Bayesiano Ruy Luiz Milidiú.
MSCC – Revisão de Probabilidade e Estatística
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
RESOLVA OS CÁLCULOS EM SEU CADERNO.
Matemática Discreta I BCC101
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Sistemas Especialistas Probabilísticos -SEP Sílvia Modesto Nassar Departamento de Informática e de Estatística - INE Centro Tecnológico.
OPERAÇÕES COM MONÔMIOS E POLINÔMIOS
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
Algoritmos e Programação I
Probabilidade Experimento Aleatório Espaço Amostral
PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA 2015.
Modelos Probabilísticos
Universidade Federal da Paraíba Departamento de Informática Introdução à Engenharia de Computação Álgebra de Boole.
Classificadores Bayesianos Classificadores Bayesianos são classificadores estatísticos que classificam um objeto numa determinada classe baseando-se na.
Mineração de Dados (Data Mining)
Introdução a Programação Aula 02 Jackson Eduardo
EAD-5853 Aula 07 Abraham Yu Natália Eiro EAD-FEA.
Universidade de Passo Fundo Tecnologia em Sistemas de Informação TSI109- Fundamentos de Banco de Dados (Restrições de Integridade) Prof. Alexandre Tagliari.
A ULA 3 B IOESTATÍSTICA James Dean Oliveira dos Santos Júnior.
Transcrição da apresentação:

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG Um Problema para Você Resolver Análise de Impacto de Mudança de Software –Seja o grafo de dependência entre classes de software

Marcus Sampaio DSC/UFCG M = {A, B, C}, o conjunto das classes de mudança, constituído pelas classes que não são terminais do grafo de dependência I = {E, F}, o conjunto das classes impactadas, constituído pelas classes terminais do grafo de dependência M  I =  –A interpretação: se algumas classes pertencentes a M mudarem (validarem), então algumas classes pertencentes a I também mudam (validam)

Marcus Sampaio DSC/UFCG Um Problema...: Histórico de Mudanças ABCEFTotal

Marcus Sampaio DSC/UFCG 1-) Qual é a probabilidade de E mudar, se A e B mudarem? 2-) Qual é a probabilidade de A mudar, independentemente de mudanças das outras classes? 3-) Se A mudar, qual a probabilidade de C ou E ou F também mudarem? 4-) Qual é a confiabilidade dos resultados?

Marcus Sampaio DSC/UFCG Teoria de Probabilidade Probabilidade Condicional –Qual a probabilidade de Y acontecer, dada a probabilidade de X acontecer? –P(Y | X) = P(XY) / P(X) –Exercício 5-): Resolva o exercício 1-) em termos de probabilidade condicional

Marcus Sampaio DSC/UFCG Lei da Probabilidade Total –Seja A 1,..., A k uma partição de um conjunto de eventos (um histórico) A 1 ...  A k =  –Seja B um evento qualquer –P(B) =  i=1,k P(B | A i )P(A i ) –Exercício 6-): Resolva o exercício 2-) em termos da lei da probabilidade total

Marcus Sampaio DSC/UFCG Teorema de Bayes –Seja A 1,..., A k uma partição, com P(Ai) > 0 –Se P(B) > 0 –P(A i | B) = P(B | A i ) P(A i ) /  j P(B | A j )P(A j ) –Exercício 7-): Resolva o exercício 3-) em termos do teorema de Bayes

Marcus Sampaio DSC/UFCG Qual é o Problema Básico da Teoria da Probabilidade? O problema básico da Teoria da Probabilidade é Dado um processo de geração de dados  por exemplo, o processo de manutenção de um software  quais são as propriedades dos dados observados?

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG Qual é o Problema Básico da Mineração de Dados? O problema básico da Mineração de Dados (“Data Mining”) é o inverso da probabilidade Dados os resultados, o que podemos induzir ou inferir sobre o processo que gerou os dados? Voltando ao grafo de dependência de classes de software do slide 3, um algoritmo de mineração de dados (MD) poderia induzir a seguinte regra de associação –Se A e B mudam então E também muda, com suporte igual a 2 e confiança (c) igual a 67%

Marcus Sampaio DSC/UFCG Formalmente –AB  E, sup=2 c=67% –O suporte é o número de vezes que A, B e E mudaram juntas –A confiança mede a associação entre AB e E, ou seja, nas tantas vezes em que A e B mudaram, quantas vezes E também mudou c = sup(ABE) / sup(AB) = 2 / 3 = 67% (veja a tabela do slide 5) –Note que esta confiança não é ‘confiável’ porque o suporte da regra é muito baixo

Marcus Sampaio DSC/UFCG MD & Probabilidade Data generating process Observed data Probability Data Mining Fonte: All of Statistics, Larry Wasserman

Marcus Sampaio DSC/UFCG Regra de Associação e Probabilidade Condicional –No que segue, X representa um conjunto de itens quaisquer (classe de software é um exemplo de item) –Seja a regra de associação X  Y, c = sup(XY) / sup(X) Interpretação probabilística: Qual a probabilidade de Y acontecer dada a probabilidade de X acontecer? –P(Y | X) = P(XY) / P(X) = (sup(XY) / Universo) / (sup(X / Universo) = sup(XY) / sup(X) = c

Marcus Sampaio DSC/UFCG Conclusões De tudo o que foi exposto, pode-se concluir que mineração de dados e probabilidade estão ligadas umbilicalmente, ou que são as duas faces de uma mesma moeda No fundo, algoritmos de mineração de dados induzem conhecimento  regra de associação é um dos inúmeros modelos de conhecimento  implementando convenientemente modelos probabilísticos, entre outras disciplinas –Abordagem bem diferente da inteligência artificial, que é baseada em lógica matemática