Aluno: Rodrigo Estevan Bela Orientadora: Profa. Dra. Marilde T. P. Santos Co-Orientador: Prof. Dr. Mauro Biajiz Ontologias de domínio auxiliando tarefas.

Slides:



Advertisements
Apresentações semelhantes
Modelagem computacional no ensino de Física
Advertisements

Técnicas e Projeto de Sistemas André Mesquita Rincon Processo de Software Técnico Subsequente – Módulo III.
Técnicas e Projeto de Sistemas
Técnicas e Projeto de Sistemas
INTRODUÇÃO À COMPUTAÇÃO PARALELA
SQL Procedural Junho/2006.
Introdução à Consulta 24/3/06. Categorias de comandos DDL : estruturação de objetos de BD Ex. create table, drop index, alter table... DML: manipulação.
O USO DE ATIVIDADES PRODUTIVAS COMO AVALIAÇÃO E INTERVENÇÃO EM TERAPIA OCUPACIONAL Bolsista: Ana Paula Scheffer Voluntária Orientador: Prof. Dr. Milton.
Avaliação das zonas ripárias da bacia hidrográfica do rio Corredeiras, SC Pedro Thiago Ramin da Silva Orientador: Prof. Dr. Irani dos Santos Colaboradores:
Universidade Federal da Bahia – Centro de Processamento de Dados – Preview Computadores 1 Uma Ferramenta Orientada a Modelos para Geração de Aplicações.
Treinamento GP3 USP – GEFIM Abril de 2004 Alcides Pietro, PMP.
Prof. Dr. Helder Anibal Hermini
Bom (boa) dia tarde noite !!.
APLICAÇÕES DA INFORMÁTICA NO ENSINO Profa. Dra. Maria Helena Baena de Moraes Lopes.
Teste Estrutural de Software
Teste Funcional de Software
Governo do Estado do Tocantins Secretaria da Educação e Cultura
Índice de Desenvolvimento da Educação Básica – Ideb
Registro de Carta Topográfica
Aprendizagem Psicologia da Educação Profª Dinamara Selbach Turmas 301N – 302N Março/2013.
Webcast Gestão da Manutenção Histórico de Aplicações e Manutenções.
Mais sobre classes Baseada no Livro: Deitel&Deitel - C++ How To program Cap. 7 Prentice Hall 1994 SCE 213 Programação Orientada a Objetos, ICMC - USP 2.
Geração de Código Cap. 8. Introdução Fase final para um compilador Entrada é uma representação intermediária do código fonte e a saída é um programa para.
Geração de Código Algoritmo de Escalonamento de instruções – List Scheduling.
Introdução aos Sistemas de Informação Gerencial Profa. Jiani Cardoso Fundamentos de Sistemas de Informação 02/set/2005.
Banco de Dados I Profa. Jiani Cardoso 2/2005
O Fluxo de Testes © Alexandre Vasconcelos
UNIVERSIDADE DE PASSO FUNDO
Curso de Engenharia Industrial Madeireira – UFPR Prof. Umberto Klock
"Tudo o que acontece, acontece em algum lugar." Gilberto Câmara - INPE Gilberto Câmara - INPE.
"Tudo o que acontece, acontece em algum lugar."
Tratamento da indexação de documentos no LexML: como compatibilizar os múltiplos vocabulários? João Lima Senado Federal / Prodasen
Sistemas de Tutoria Inteligente (STI) Visam proporcionar instrução de forma adaptada a cada aprendiz. STIs adaptam o processo de instrução a determinadas.
CT-300 – Seminário de Tese 1/25 Um Framework Padrão para Simulação de Modelos de Robôs Móveis de Robôs Móveis Juliano A. Pereira Prof. Carlos H. C. Ribeiro.
Matemática e Educação Ambiental.
Curriculum and Instruction in Automated Tutors in Polson & Richardson Resumo.
01/08/20061 CT-282 Tutores Inteligentes ITA - INSTITUTO TECNOLÓGICO DE AERONÁUTICA.
CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira
01/08/20061 CT-282 Tutores Inteligentes ITA - INSTITUTO TECNOLÓGICO DE AERONÁUTICA.
Gerenciamento de Dados Instituto Tecnológico da Aeronáutica – ITA CE-245 Tecnologias da Informação Professor Adilson Marques da Cunha Aluna: Michelle.
CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Lógica de Descrições.
Capítulo I – Conceitos Primários 1.1 – Estrutura de um computador 1.2 – Informações manipuladas por um computador 1.3 – Evolução das linguagens de programação.
I – Informação Digital – Tema de Discussão Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações.
I – Informação Digital – Trabalho Grupo Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP-018 – O Produto Internet e suas Aplicações.
Informação para a Gestão em Saúde: Rede Gaúcha de Informações em Saúde Participação no 1 º Seminário de Disseminação das Experiências Inovadoras no SUS.
BlastPhen Aluno: Ricardo Nishikido Pereira
Proposta de critérios e procedimentos para a concessão da GDAR Matuzalém Batista Pereira Elisa Vieira Leonel Fábio Santos Lobão Ricardo de Holanda Melo.
TE 043 CIRCUITOS DE RÁDIO-FREQÜÊNCIA
Desempenho A rápida taxa de melhoria na tecnologia de computadores veio em decorrência de dois fatores: avanços na tecnologia utilizada na construção.
UERJ - Agosto 2000© Oscar Luiz Monteiro de Farias1 Bancos de Dados Mestrado em Engenharia de Computação área de concentração Geomática.
Recursividade Estrutura de Dados.
METODOLOGIA DE PESQUISA EM EDUCAÇÃO INTRODUÇÃO A PESQUISA ACADÊMICA Roberval Francisco de Lima SÃO ROQUE 2006.
Ilan Chamovitz, D.Sc. - 1 Fundamentos da Lógica Nebulosa para Inovação em processos de avaliação educacional - relato de experiência Ilan.
The Data Warehouse Toolkit
WOntoVLab: Uma Arquitetura para Laboratórios Virtuais Baseada em Workflows e Ontologias Aluno: Daniel Cintra Cugler Orientadora: Profª. Dra. Marilde T.
Taxonomias Difusas em Tarefas de Mineração (Status do Projeto)
Aluno: Rodrigo Estevan Bela Orientadora: Profa. Dra. Marilde T. P. Santos Co-Orientador: Prof. Dr. Mauro Biajiz Ontologias de domínio auxiliando tarefas.
LINGUAGENS DE PROGRAMAÇÃO
Sistemas de Informação Prof. Me. Everton C. Tetila Modelo de dados relacional Banco de Dados I.
Silva, Ribeiro, Dias, Sousa Desenho Técnico Moderno MAIS PROJECTOS TIPO EM CAD © LIDEL EDIÇÕES TÉCNICAS 1 Desenho Técnico Moderno Capítulo 15 – Mais Projectos.
Introdução Ciência da Computação estudo de algoritmos –ÊNFASE ao estudo de DADOS armazenamento manipulação refinamento (a partir de dados cru) estrutura.
1 Seja o resultado de um experimento aleatório. Suponha que uma forma de onda é associada a cada resultado.A coleção de tais formas de ondas formam um.
Provas de Concursos Anteriores
1 António Arnaut Duarte. 2 Sumário: primeiros passos;primeiros passos formatar fundo;formatar fundo configurar apresentação;configurar apresentação animação.
Coordenação Geral de Ensino da Faculdade
1 2 Observa ilustração. Cria um texto. Observa ilustração.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo de Probabilidades. Regra de Laplace. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
SairPróximo Itens de Seleção Probabilidades e Combinatória Cálculo Combinatório. Problemas de Contagem. ITENS DE SELEÇÃO DOS EXAMES NACIONAIS E TESTES.
MATRICIAL CONSULTORIA LTDA. PREFEITURA MUNICIPAL DE GARIBALDI 23/10/ : ATENÇÃO Os locais descritos nas planilhas anexas não correspondem ao total.
CALENDÁRIO SEXY Ele & Ela. CALENDÁRIO SEXY Ele & Ela.
Transcrição da apresentação:

Aluno: Rodrigo Estevan Bela Orientadora: Profa. Dra. Marilde T. P. Santos Co-Orientador: Prof. Dr. Mauro Biajiz Ontologias de domínio auxiliando tarefas de mineração de dados: anotações semânticas e filtros de regras

2/42 Contextualização Proposta Estudo de Caso Trabalhos Correlatos - Discussão Conclusão Agenda

3/42 Contextualização Mineração de Dados Desafios de pesquisa Ontologias Anotações Proposta Estudo de Caso Discussão - Trabalhos Correlatos Conclusão Agenda

4/42 Extração de conhecimento de bases de dados é o processo de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis embutidos nos dados [Fayyad, U., G.P. Shapiro, and P. Smyth, 1994] Utiliza processos não convencionais para realizar a extração dos padrões. Envolve técnicas de diversas áreas Banco de Dados, Estatística, Aprendizado de Máquina, Reconhecimento de Padrões, Inteligência Artificial e outras. Mineração de Dados

5/42 Processo iterativo e interativo Conhecimento do domínio tem impacto em todas as etapas O conhecimento sobre o domínio subsidia tomadas de decisão nas etapas subsequentes do processo de Mineração de Dados [Melanda, E. A., 2004] Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed O processo de Mineração de Dados

6/42 Identifica itemsets, conjuntos de itens que tendem a ocorrer juntos em transações. Gera regras da forma: A B Métricas de avaliação: Suporte: a porcentagem de transações, em relação ao todo, que contém A e B; Confiança: a porcentagem de transações que contém A que também contém B. Assim, se A B (suporte 0.4 / confiança 0.9): Então, 40% das transações contém A e B; Em 90% das vezes que a transação contém A, ela também contém B.

7/42 Desempenho de algoritmos Avaliar automaticamente o grau de interesse dos padrões encontrados Técnicas de visualização eficientes para padrões mais complexos Enriquecer o processo com o conhecimento do domínio Tratamento de informações já conhecidas ou desinteressantes. Desafios de Pesquisa em Mineração de Dados

8/42 Enriquecer o processo com o conhecimento do domínio Como representar o conhecimento? Como utilizar o conhecimento como entrada nos algoritmos de mineração? Como e quais decisões podem ser tomadas pelo algoritmo com base no conhecimento inserido? Tratamento de informações já conhecidas ou desinteressantes. Como tratar informações que já fazem parte do conhecimento do domínio? Desafios de Pesquisa em Mineração de Dados

9/42 Uma ontologia é uma especificação formal e explícita de uma conceitualização compartilhada [Gruber, T.R., 1993] Conceitualização Explícita Formal Compartilhada Ontologias

10/42 Uma ontologia é uma descrição explícita de um domínio, constituída por Conceitos [classes] Propriedades [atributos e relacionamentos] Axiomas [restrições sobre as propriedades] Instâncias [dos conceitos] Uma ontologia define Um vocabulário comum Um entendimento compartilhado Ontologias

11/42 Todo o conjunto de marcas, notas, breves comentários e explicações adicionais que são realizadas sobre algum tipo de conteúdo O contexto e a forma de utilização definem formas especificas, como: Metadados Conteúdos Hipertexto Contexto Anotações

12/42 Bibliotecas digitais Web Estratégias de busca Banco de dados Anotações: aplicações

13/42 Contextualização Proposta Problemas Anotações Semânticas Filtro de Regras Estudo de Caso Discussão - Trabalhos Correlatos Conclusão Agenda

14/42 Enriquecer o processo com o conhecimento do domínio Como explicitar o significado presente em alguns conjuntos de dados brutos? Como possibilitar a melhor visualização de dados brutos? Tratamento de informações já conhecidas ou desinteressantes. Como tratar informações que já fazem parte do conhecimento do domínio?

15/42 Anotações Semânticas! Metadados adicionais que descrevem o significado. Significado descrito usando termos controlados. Utilização de ontologia de domínio para definir o significado e vocabulário. Que possam ser geradas automaticamente.

16/42 1 ::= se = verdadeiro então 2 ::= { } α 3 ::= | 4 ::= 5 ::= = | > | < | != 6 ::= { } 7 ::= 8 ::= AND | OR 9 ::=A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|X|Y|Z|0|1|2|3|4|5|6|7|8|9 α = o termo deve ser uma seqüência de caracteres que esteja presente na ontologia do domínio, ou seja, deve representar uma classe, propriedade ou relacionamento. β = considerar as regras de construção de expressões SQL definida pelo BNF Grammar for ISO/IEC :2003 – Database Language SQL (SQL-2003) - SQL/Foundation. Tabela com as regras de produção para geração de regras de mapeamento Select avg(n.nota) as resultado from notas as n inner join aluno as a on n.aluno_id = a.id... (Select avg(n.nota) as resultado from notas as n inner join aluno as a on n.aluno_id = a.id...) > 6.0 6,0

17/42 Representação das principais atividades realizadas na SATO

18/42 Principais tela da SATO: A)Definição de um domínio; B) Definição de regra de mapeamento baseada em consulta; C) Definição de regra de mapeamento lógica; D) Visualização de anotações semânticas geradas

19/42 Utilizar conhecimento definido na ontologia. Considerar que termos da ontologia são um item dentro da regra Considerar propriedades entre conceitos como associações já conhecidas. Usuário define quais propriedades devem ser avaliadas.

20/42 1 para cada regra 2 removerRegra verdadeiro; 3 para cada item do lado esquerdo da regra 4 para cada item do lado direito da regra 5 se item do lado esquerdo não tem relacionamento com lado direito 6 removerRegra falso; 7 fim se 8 fim para 9 10 Se removerRegra = verdadeiro então 11 listaDeRegrasASeremRemovidas regraAtual 12 fim se 13 fim para Pseudocódigo do Filtro de Regras de Associação maçã frango, maionese frango maçã associada_com maçã frango, maionese

21/42 Aplicação de Filtro Varrer a base Identificar Itens Similares Gerar Candidatos Calcular o peso dos Candidatos Avaliar os Candidatos Gerar as Regras Generalização e Tratamento de Redundância Aplicação de Filtro Generalização e Tratamento de Redundância Passos do algoritmo Filtered-NARFO.

22/42 Contextualização Proposta Estudo de Caso Introdução – contexto Processo de Mineração de Dados Discussão - Trabalhos Correlatos Conclusão Agenda

23/42 Dados da ferramenta de ensino LECH-GEIC. Ferramenta baseada no paradigma de Equivalência de Estímulos Ferramenta desenvolvida no contexto do projeto TIDIA-Ae fase II. Dados descrevem respostas dadas por estudantes durante interação com a ferramenta.

24/42 Organização de um programa de Ensino Exemplo dos dados coletados pela ferramenta

25/42 Conhecimento sobre o domínio Construção da ontologia de domínio necessária Definição dos objetivos do processo: Verificar as relações de comportamento presentes nos dados; Suporte e confiança como métricas de desempenho; Conhecimento obtido deve ser claro e de fácil compreensão.

26/42 Geração de anotações para um conjunto de 30 sessões de ensino. Sessões referentes a um passo que ensina as relações AC (mts som-texto) e AE (cr som-texto) para as palavras: vaca, bolo e tatu. Definição de regras de mapeamento para: Comportamentos/Termos a serem gerados: ACTreinoTatuSim, ACTreinoTatuNao e outras; Geração de anotações para as latências observadas, como: ACLatenciaMuitoBaixa, AELatenciaMuitoBaixae outras.

27/42 Redução da dimensionalidade dos dados sem perda de significado ACTreinoTatuSIM 88 Tuplas select if ((select count(se.id) from sessaoexec se inner join sessaoexec_passoexec sepe on se.id = sepe.sessaoexec_id inner join passoexec pe on pe.id = sepe.passosExecutados_id inner join passoexec_blocoexec pebe on pe.id = pebe.passoexec_id inner join blocoexec be on be.id = pebe.blocosExecutados_id inner join blocoexec_tentativaexec bete on be.id = bete.blocoExec_id inner join tentativaexec te on te.id = bete.tentativasExecutadas_id inner join tentativaexec_tentativainteracao teti on te.id = teti.tentativaexec_id inner join tentativainteracao ti on ti.id = teti.interacoes_id inner join blocotentativaocorrencia bto on bto.id = te.ocorrencia_id inner join passoblocoocorrencia pbo on pbo.id = be.ocorrencia_id where se.id = ?transacao? and bto.bloco_id = 18 and pbo.ocorrencia = 3) > 0….

28/42 Comparações entre 3 algoritmos de regras de associação: Apriori, NARFO e Filtered-NARFO. Comparação de vários níveis de conhecimento. Objetivos: Validar algoritmos; Validar filtro; Observar impacto do conhecimento no filtro; Atingir objetivos definidos pelo especialista no processo;

29/ Tabela com as interações realizadas Versões da Ontologia de Domínio ACLatenciaMuitoBaixa~ACLatenciaBaixa AETesteVacaNao,AETesteTatuNão sup=0.38 conf= (Possuindo item 'ACLatenciaBaixa' com maior relevância!!!) ACLatenciaBaixa AETesteVacaNao,AETe steTatuNao sup= conf= AETeste->ACTreinoBoloNao sup= conf=1.0

30/42 Apresentação dos resultados a especialista do domínio; Validação do filtro de regras; Validação de comportamentos esperados; Novos indícios para pesquisa: ACLatenciaMuitoBaixa~ACLatenciaBaixa AETest eVacaNao,AETestTatuNão sup=0.38 conf= (Possuindo item 'ACLatenciaBaixa' com maior relevância!!!)

31/42 Contextualização Proposta Estudo de Caso Discussão - Trabalhos Correlatos Conclusão Agenda

32/42 Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed [kuo, Y.-T., A. Lonie, and L. Sonenberg, 2007]

33/42 Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed [Sidhu, A.S., T.S. Dillon, and E. Chang, 2007] [Zhou, X. and J. Geller, 2007] [Bogorny, V., P.M. Engel, and L.O. Alvares, 2007]

34/42 Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed [Khelif, K., R. Dieng- Kuntz, and P. Barbry, 2007] [Pahm, M.H., et al, 2007] [Miani et al, 2009]

35/42 Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed [STAMOU et al. 2007]

36/42 Extraído do Livro Sistemas Inteligentes. Capítulo sobre Mineração de Dados. Rezende, S. O. 1 ed [Trousse, B., et al, 2007] [Mothe, J. and N. Hernandez, 2007] [Kotsifakos, E., G. Marketos, and Y. Theodoridis, 2007]

37/42 Utilização do conhecimento em todas as etapas do processo; Identificação do problema: entendimento dos dados, de seus significados e potenciais; Pré-processamento: explicitação do significado dos dados por meio da geração de anotações semânticas; Extração de padrões: redução da complexidade da tarefa, Pós-processamento: filtro de regras já conhecidas; Utilização do conhecimento: conhecimento obtido pode ser utilizado para atualizar a ontologia

38/42 ACTreinoTatuSIM 88 Tuplas ACLatenciaMuitoBaixa~ACLatenciaBaixa AETesteVacaNao,AETestTatuNão sup=0.38 conf= (Possuindo item 'ACLatenciaBaixa' com maior relevância!!!)

39/42 Ontologia de Domínio para a Equivalência de Estímulos; Uma abordagem para a geração de anotações semânticas para dados brutos; Um protótipo de ferramenta para a geração de anotações; Uma proposta para a realização de filtros de regras de associação; Algoritmo Filtered-NARFO que aplica a abordagem de filtro de regras; Um estudo de caso real que foi viabilizado pelas propostas e ferramentas apresentadas.

40/42 Melhorar ferramenta SATO. Aplicação da abordagem proposta com dados de outros domínios. Combinar conhecimento do domínio com métricas de interesse para avaliar regras. Identificar exceções por meio do conhecimento do domínio. Algoritmo baseado no Filtered-NARFO para extrair padrões sequenciais.

41/42 Pôster Geração Automática de Anotações Semânticas para o Domínio de Controle de Estímulos no Second Brazilian Workshop on Semantic Web and Education, workshop satélite ao Simpósio Brasileiro de Informática na Educação de 2008; Resumo Stimuli: uma ontologia para o paradigma de Equivalência de Estímulos no I Portuguese and Multi- lingual Ontologies Workshop, workshop satélite ao 7th Brazilian Symposium in Information and Human Language Technology Demo SATO: uma ferramenta para a geração de anotações semânticas na sessão de Demos do Simpósio Brasileiro de Banco de Dados (SBBD 2009)

42/42 Obrigado!