Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.

Slides:



Advertisements
Apresentações semelhantes
Escola Politécnica de Pernambuco Departamento de Ensino Básico
Advertisements

Simulação de Sistemas Antonio J. Netto AULA1.
Estatística Dados valores (amostras) de variáveis aleatórias X1, X2, ..., Xn, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.
CAPÍTULO 7 TESTE DE HIPÓTESE
Laboratório WEB Professora: Viviane de Oliveira Souza Gerardi.
Sistemas Periciais com Conhecimento Incerto 1 Sistemas Periciais Tradicionais Funcionam assumindo que tudo é Verdadeiro ou Falso Qualquer regra cujas condições.
ANÁLISE DISCRIMINANTE
CAPÍTULO 7 TESTE DE HIPÓTESE
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
Lógica de Fuzzy Um pouco sobre Fuzzy.
Aprendem a partir de seus vizinhos AULA 9 DATA MINING Sandra de Amo
2. O Processo de Mineração de Dados
Análise de Regressão Prefácio.
Medida do Tempo de Execução de um Programa
Medida do Tempo de Execução de um Programa
Jacques Robin, Francisco Carvalho, Flávia Barros
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
FACENS – Engenharia da Computação Inteligência Artificial
Irineu Júnior Pinheiro dos Santos Mirela Ferreira César
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Complexidade de Algoritmos
3. Árvore de Decisão.
Lógica Matemática e Computacional
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG.
Aula Prática Classificação
Programação Avançada Prof. Natalia Castro Fernandes
Implementar Primeirão em Java Eduardo Figueiredo 25 de Março de 2010 POOAula 06.
Probabilidade.
Aula 03 – BCC202 Análise de Algoritmos (Parte 1) Túlio Toffolo www
Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.
Aprendizado Bayesiano
Desenvolvimento Rápido de Aplicação (RAD)
PROGRAMAÇÃO ORIENTADA A OBJETO - JAVA
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Sistemas Baseados em Aprendizado (Aprendizado de Máquina)
1 Naïve Bayesian Learning Marcílo Souto DIMAp/UFRN.
WEKA Jacques Robin João Batista Marcelino Pereira junho/2001.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
F. Verani, F.Laender, E. Maranhão
Probabilidade e Mineração de Dados
1 2º Ciclo de Estudos – Mestrado Informática Médica Docente: Inês Dutra Alunos: João Janeiro Luis Martinez Ricardo Casal Disciplina: Sistemas de Apoio.
7. Mineração de Texto ("Text Mining")
A Systematic Approach for Inducing Reliable Classifiers From Data Mines David Moises Barreto dos Santos Universidade Federal de Campina Grande Programa.
MSCC – Revisão de Probabilidade e Estatística
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto- treinamento, e.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Apresenta:.
Marcus Sampaio DSC/UFCG Vários slides foram adaptados, traduzidos ou copiados de Pang-Ning Tan (ver Bibliografia)
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG URL: Função: Classificação Técnica: Árvore de Decisão.
Laboratório 5 Regras. Bases Utilize a base que se encontra no diretório de dados do weka: wheather.nominal.arff Gere regras usando diferentes classificadores.
Marcus Sampaio DSC/UFCG Os slides 3-15 foram copiados de Pang-Ning Tan.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Projetos de descobertas de conhecimento em banco de dados e mineração de dados Jacques Robin, Francisco de Assis e Paulo Adeodato CIn-UFPE.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG CEAPE-PB Centro de Apoio aos Pequenos EMPREENDIMENTOS – CEAPE-PB, com sede na Cidade de Campina Grande.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Classificação Não Supervisionada As instâncias não são previamente classificadas Um algoritmo de classificação.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG A Lógica dos Algoritmos “Covering” A estratégia é selecionar cada classe do conjunto-treinamento, e procurar.
Fernando Santana 2 PPN Fotografia. Público Alvo Características Pessoas entre 20 e 32 anos. Profissionais com mais de 5 anos no mercado Formados: Tecnologia.
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
Probabilidade Probabilidade Condicional Teorema do Produto
Tecnologias e Sistemas de Informação
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Classificadores Bayesianos Classificadores Bayesianos são classificadores estatísticos que classificam um objeto numa determinada classe baseando-se na.
Estatística Aplicada Larson Faber
Laboratório de Mídias Sociais
Mineração de Dados (Data Mining)
1-De acordo com Descartes:
Métodos Probabilísticos
Laboratório de Classificação Supervisionada Laboratório de Geoprocessamento do Departamento de Engenharia de Transportes da EPUSP setembro de 2011.
Transcrição da apresentação:

Marcus Sampaio DSC/UFCG

Marcus Sampaio DSC/UFCG NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes um do outro, dada uma classe Apesar desta suposição irrealista, ela conduz a um esquema bastante simples, com resultados surpreendentemente bons A idéia é contar quantas vezes cada par atributo-valor ocorre com cada valor do atributo-classe Este método simples e intuitivo é baseado na Regra de Bayes, de probabilidade condicional

Marcus Sampaio DSC/UFCG Usaremos o problema do tempo, como exemplo

Marcus Sampaio DSC/UFCG Estado/Temperatura simnão simnão ensolarado23quente22 nublado40amena42 chuvoso32fria31 ensolarado2/93/5quente2/92/5 nublado4/90/5amena4/92/5 chuvoso3/92/5fria3/91/5

Marcus Sampaio DSC/UFCG /Umidade /Ventania Jogo simnão simnão simnão alta34falso62 95 normal61verdade33 alta3/94/5falso6/92/5 normal6/91/5verdade3/93/5 9/145/14

Marcus Sampaio DSC/UFCG A idéia de um programa Oráculo, ou Preditor, baseado em estatísticas de Bayes

Marcus Sampaio DSC/UFCG EstadoTemp.UmidadeVentaniaJogo ensol.friaaltaverdade?

Marcus Sampaio DSC/UFCG Probabilidade de ter jogo (tem_jogo = 'sim') –2/9 x 3/9 x 3/9 x 3/9 x 9/14 = Probabilidade de não ter jogo (tem_jogo = 'não') –3/5 x 1/5 x 4/5 x 3/5 x 5/14 = Conclusão: para o dia previsto  ensolarado, frio, ventoso e com umidade alta  é aproximadamente quatro vezes mais provável que não haja jogo

Marcus Sampaio DSC/UFCG Probabilidades em percentagem –P[sim] = / ( ) = 20.5% –P[não] = / ( ) = 79.5%

Marcus Sampaio DSC/UFCG Exercício Individual Biblioteca WEKA –Muitos arquivos de dados –Técnicas de fragmentação: “Holdout” e “Cross Validation” –Algoritmos: 1R, Id3, J48, Prism, NaïveBayes –Para um arquivo de dados ‘Rode’ os 6 processos Entenda os resultados –Procure, na wikipedia, o significado de Algumas estatísticas (Kappa,...) Matriz de confusão Qual o melhor processo? –Documente tudo, e entregue –Prazo: 30/10