Geração de classificadores Generalização de exemplos.

Slides:



Advertisements
Apresentações semelhantes
FAPE - Curso de Ciência da Computação
Advertisements

FAPE - Curso de Ciência da Computação
Tópicos em Compiladores
Introdução à Ciência da Computação Linguagens de Programação.
Compiladores Claudio Benossi
I - Noções dum compilador
I - Noções dum compilador
O modelo morfossintático -
Compiladores I Cristiano Damiani Vasconcellos
O modelo morfossintático
Prof. Yandre Maldonado e Gomes da Costa
Linguagens Formais e Autômatos
Deyvisson, Rafael M.P., Renato, Robson C.F., Rodolfo
TEORIA DOS AUTÓMATOS FINITOS E DAS SUAS LINGUAGENS
Araken de Medeiros Santos Anne Magály de Paula Canuto
Software Básico Silvio Fernandes
Aprendem a partir de seus vizinhos AULA 9 DATA MINING Sandra de Amo
PREDICATIVO DO SUJEITO DO OBJETO.
PREDICATIVO DO SUJEITO DO OBJETO.
Reconhecimento de Padrões Receiver Operating Characteristics (ROC)
Q={s,q1,…,q10,t,r} ={a,b,c} ={├,■,} Função de transição:
Identificando Linguagens Não Regulares
KRIGAGEM INDICATIVA No processo básico da krigagem, a estimativa é feita para determinar um valor médio em um local não amostrado. Pode-se, porém, fazer.
Relações em uma Gramática
Gramáticas Estocásticas Livre de Contexto Anderson Faustino da Silva.
Construção de Compiladores
Exercícios Linguagens Formais.
Análise de Dados.
Língua Portuguesa 3º ano Ensino Médio
Profa Célia Trindade de Araújo e Silva
Informática Teórica Engenharia da Computação
Informática Teórica Engenharia da Computação
Compiladores, Aula Nº 5 João M. P. Cardoso
Compiladores, Aula Nº 9 João M. P. Cardoso
ANOVA: Análise de Variância APLICAÇÃO.
Gramáticas Livres de Contexto
Modelo Morfossintático
PRINCIPAIS DELINEAMENTOS DE PESQUISA
Análise Léxica Primeira fase de um compilador
Capítulo V – Reconhecimento de Padrões
Identificação de Voz Marcelo Lucena André Palhares.
Capítulo II Gramáticas e Linguagens
Analise sintática aula-07-analise-sintática.pdf.
Orações Subordinadas Substantivas
Analise Semântica aula-10-analise-semântica.pdf.
ESTUDOS MORFOSSINTÁTICOS: SINTAXE
MORFOLOGIA O QUE É MORFOLOGIA?
Aula 12 1 Análise Sintáctica Compiladores, Aula Nº 12 João M. P. Cardoso.
Tradução Dirigida por Sintaxe
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
Linguagens Livres de Contexto
Faculdade Pernambucana - FAPE Setembro/2007
COMPILADORES 04 Prof. Marcos.
Computabilidade e Linguagens Formais
Métodos Formais Juan Andrés Mussini.
PRINCÍPIO DA PROGRESSÃO
Sintaxe de uma Linguagem
Metodologia da Pesquisa em Ensino de Ciências I
Aula 6 1 Análise Lexical Compiladores, Aula Nº 6 João M. P. Cardoso.
Proporcionalidade Inversa como função
Compilador Software que traduz o texto (linguagem fonte) que representa um programa para código máquina(linguagem alvo) capaz de ser executado pelo.
Modelos de distribuições discretas de probabilidade
Faculdade Pernambuca - FAPE Compiladores Abril/2007 Compiladores Abril/2007.
Análise sintática e classe gramatical
Informática Teórica Engenharia da Computação. Teoria da Computação Contexto do que vamos começar a estudar As linguagens também podem ser definidas formalmente.
COMPILADORES 03 Prof. Marcos.
Informática Teórica Engenharia da Computação
Modelos de distribuições discretas de probabilidade
Métodos Probabilísticos
Transcrição da apresentação:

Geração de classificadores

Generalização de exemplos

Classificação Bayesiana X é uma variável aleatória Padrões  i, i = 1,..., n Para cada  k temos a função de probabilidade P(X|  k ) P(  k ) é conhecida X ~  i se P(  i ) P(X|  i )  P(  k ) P(X|  k ) para todo k = 1,..., n

Classificação bayesiana

Representação das famílias Precisamos de uma descrição para as famílias Podemos representar o DNA e o RNA por seqüências de a, c, g, t ou u Em linguagens formais: –Um conjunto de seqüências formam uma linguagem –linguagens são descritas por gramáticas

Uma gramática Frase ::= sujeito predicado sujeito ::= artigo nome artigo ::= a | o nome ::= cão | moça | dia predicado ::= verbo adjetivo verbo ::= está | estava adjectivo ::= feliz | triste

Gramática Reconhecimento Geração Árvore sintática

Gramática Uma gramática é formada por: –V t é um conjunto de símbolos terminais –V n é um conjunto de símbolos não terminais –P é um conjunto de produções –S é o símbolo inicial

Classes gramaticais (cont.) Regulares: –A  a | a B Livres de Contexto: –A  a B C f d Sensíveis ao Contexto: –a A D  a B C f d

Gramática regular S ::= a S | u S | g S | c S | a | u | g | c Ex: uaggcuacgccagcau

Gramática livre de contexto S ::= a S u | u S a | c S g | g S c | 

Gramática livre de contexto S ::= a S u | u S a | c S g | g S c | A A ::= A a | A u | A c | g A | a | u | c | g

Gramática livre de contexto S ::= a S u | u S a | c S g | g S c | SS

SCFG e estrutura secundária (slide de Ariane Machado Lima)

Gramática sensível ao contexto

A ::= a z B | a m B zB ::= zul mB ::= marelo

Classes gramaticais Diferentes complexidades Regular já é interessante: –gramática de seqüência clonada –HMM

Gramáticas estocásticas S ::= Prom SeqCod [1] Prom ::= TATA Seq [0.6]... SeqCod ::= Cod SeqCod [0.998] SeqCod ::= Stop [0.002] Cod ::= Lys [0.03] Cod ::= Asp [0.035]...

Gramáticas estocásticas cada gramática gera uma distribuição de probabilidades classificadores –bayesianos –? threshold? problema: probabilidade da sequência inversamente proporcional ao número de produções aplicadas na árvore sintática –isso pode dar problema mesmo na abordagem bayesiana classificação binária –z score.

Resultados: Data searching NLL- score: –Negative Log Likelihood -log (P(Seq | gramática)) –Dependente do tamanho da seqüência de teste mais precisamente do número de produções utilizados em GRE numero de produções igual ao tamanho –Precisa de normalização

Z- score Tenha uma amostra positiva e uma negativa Para cada tamanho de seq negativa (número de produções), calcule o NLL médio negativo Pontos não cobertos -> interpolação Para cada seq da amostra (+ e -), calcule seu Z-score: (NLL(X) – NLL med,neg,tam=x ) Z tam=x (X)= DesvioPadrão(NLL neg,tam=x ) Plote esses valores em um gráfico Z x nr seq Encontre um limiar que separe as amostras + e - –3,8 é o mais utilizado

Gramáticas regulares vs. HMM gramáticas regulares e HMM tem poder semelhante de expressão dada uma HMM podemos desenhar uma gramática regular estocástica que gera a mesma distribuição de probabilidades

Inferência gramatical – gramáticas regulares gramáticas podem ter sua arquitetura inferida automaticamente a partir de um conjunto de sequências –árvore de prefixos –generalizações por junção de nós probabilidades podem ser inferidas conjuntamente ou em separado