Jacques Robin, Francisco Carvalho, Flávia Barros

Slides:



Advertisements
Apresentações semelhantes
Construção de listas de decisão Os tópicos anteriores tratam de indução de conceitos que podem ser descritos usando uma única região de decisão Neste tópico.
Advertisements

Agenda Introdução Justificativa Objetivo Detecção de Spam
Aprendizado de Máquina
INTELIGÊNGIA COMPUTACIONAL
Observação e registro Programa de estudos pós graduados em psicologia experimenta: análise do comportamento Flávia vieira de Souza Leite.
Mineração de Dados Avaliação de Classificadores
Exercício 1 Rodar o algoritmo de classificação J4.8 do Weka variando:
Aprendizado de Máquina
Analise e Seleção de Variáveis
Laboratório 3 Aprendizado Baseado em Instâncias e Naive Bayes
Reconhecimento de Padrões Aprendizagem Supervisionada (KNN)
Weka Coleção de algoritmos de aprendizado de máquina implementado em Java Tanto é API como aplicativo!!! Open source software Framework para o desenvolvimento.
1 Projeto Filtragem de Mensagens Eletrônicas Disciplina: Inteligência Artificial Simbólica Professores: Geber Ramalho e Jacques Robin.
FACENS – Engenharia da Computação Inteligência Artificial
FACENS – Engenharia da Computação Inteligência Artificial
Prof. Dr. Cairo L. Nascimento Jr.
-- PNOTA -- Uma Aplicação para Correção Assistida de Questões Discursivas Filipe Wall Mutz.
Sistema Progol TÉCNICAS E HEURÍSTICAS. Progol – Tópicos Definição do sistema; Declarações de Modo; Construção da cláusula mais específica; Algoritmo de.
DATA MINING Inteligência Artificial
COGNIÇÃO E APRENDIZAGEM HUMANA
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Aprendizado de Máquina
3. Árvore de Decisão.
Aprendizado de Máquina
Aprendizado de Máquina Aula 8
Alexandre Xavier Falcão & David Menotti
Aula Prática Classificação
Classificação/Clusterização
Aprendizado Baseado em Instâncias – Algoritmo k-NN
Recuperação Inteligente de Informação Tarefa 1 Equipe.
Classificação. Classificação: Atribuição a uma classe (rótulo de um atributo categórico). Classifica dados (constrói um modelo) baseado em um conjunto.
K-Means / Clustering.
K-NN Prof. Dr. Rogério Vargas.
Mini testes A apresentar na aula da semana a seguir à data descrito em cada teste. As respostas não devem exceder mais do que duas páginas A4.
Introdução à Classificação de Texto
INF 1771 – Inteligência Artificial
INF 1771 – Inteligência Artificial
Aprendizado de Máquina - Introdução
Algoritmo e Programação
Seleção de Atributos Ricardo Prudêncio.
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Lista de Exercício IAI 2009 – Ricardo Prudêncio. Os objetivos dessa lista são: –Realizar treinamento de SVMs no WEKA –Praticar procedimento de seleção.
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Classificacao de Texto Projeto Spam Filter
Aquisição de Conhecimento
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
1 Introdução aos Agentes Inteligentes Inventando Funções Heurísticas Flávia Barros.
7. Mineração de Texto ("Text Mining")
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Classificação de Texto Baseada na aula de Henrique Borges e Ícaro Medeiros Alterada por Flávia Barros.
Classificação de Texto
27 de Junho de Floresta sintá(c)tica: um recurso para avaliação Diana Santos Susana Afonso
Inteligência Artificial I
1 Projeto X-Finder Agents Recuperação e Indexação de páginas especializadas na Web Disciplina: Inteligência Artificial Simbólica Professora: Flávia Barros.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
Aprendizado Baseado em Instancias. Introdução Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os.
Classificação de Textos
Propostas de Projetos para Especialização em IC
Eduardo Matos (ejvm) Leonardo Vilaça (lhvs) Igor Ebrahim (ies) Thiago Gomes (tgr)MW
Aprendizado por Indução
CIn-UFPE1 Recuperação Inteligente de Informação Agrupamento de Texto.
DECOM – ICEB – UFOP Prof. Álvaro Guarda Aprendizado de Máquina - 0 Aprendizado Indutivo de Conceitos Conceito Conjunto de objetos com características comuns.
Sistemas de Informação Inteligentes Aula 1 Nadilma Nunes
Mineração de Dados Classificação Felipe Carvalho – UFES 2009/2.
Aula Pratica Aprendizagem WEKA Prof. Ivan Gesteira Costa Filho Centro de Informática Universidade Federal de Pernambuco.
Laboratório de Classificação Supervisionada Laboratório de Geoprocessamento do Departamento de Engenharia de Transportes da EPUSP setembro de 2011.
Transcrição da apresentação:

Jacques Robin, Francisco Carvalho, Flávia Barros Aprendizagem de máquina para classificação de texto: parte III do projeto de Inteligência Artificial Simbólica Jacques Robin, Francisco Carvalho, Flávia Barros

Passos Escolher duas da técnicas de aprendizagem de máquina vista na disciplina: Classificador Bayesiano ingênuo, usar naivebayes do Weka Indução de arvore de decisão, usar j48 do Weka Indução de regras atributivas, usar Prism do Weka Programação em lógica indutiva, usar Progol Aprendizagem baseada em instância, usar KNN do Weka Clustering, usando algum algoritmo de clustering do Weka Transformar os dados de espaço de vetor de palavras e o rótulo positivo ou negativo do corpus para o formato aceito pelo algoritmo de aprendizagem Treinar o algoritmo com a parte de treinamento desses dados Testar o conhecimento aprendido com a parte de teste desses dados Comparar em termos de precisão, cobertura e medida F o desempenho dos dois classificadores aprendidos com o classificador manualmente codificado com JEOPS Refazer os experimento aplicando antes da aprendizagem a seleção automática de atributos do Weka

Preparação de dados para naiveBayes, j48, Prism e KNN Cada atributo é a TFIDF de cada palavra no documento e corpus O atributo classe é o valor binário + ou –

Usando Clustering Cada atributo é a TFIDF de cada palavra no documento e corpus Rodar Apriori para formar dois grupos no conjunto de treinamento Contar a proporção relativa de exemplos positivos e negativos em cada grupo Se as proporções de cada grupo são claramente diferentes (ex, grupo1 com +/- = 90%/10% e grupo2 com +/- 85%/15%) Definir métrica entre vetores de atributos (por exemplo distância euclidiana) Atribuir classe de exemplo de teste como sendo a classe majoritária do grupo cujo centro de gravidade (protótipo) mais próximo do exemplo

Usando Progol Codificar vetores TFIDF como fatos Prolog: tfidf(DocID, TfidfWord1, ..., TfidfWordN). Codificar classes dos documentos de treinamento como fatos Prolog: class(DocID, ClassName). Declarar modes Progol definindo a cara das regras a aprender, se inspirando das regras manualmente codificadas em JEOPS Definir os parametros de aprendizagem como fatos built-in do Progol Traduzir regras manuais de JEOPS para Prolog Experimentar com várias proporções dessas regras fornecidas como conhecimento a priori (ex, 0%, 10%, 25%, 50%, 100%).