Computabilidade e Linguagens Formais

Computabilidade e Linguagens Formais
Autómatos de pilha Gabriel David / Cristina Ribeiro

Autómatos e autómatos de pilha
Os autómatos de pilha estão para as linguagens sem contexto como os autómatos estão para as linguagens regulares 1 Linguagens regulares 1*0(1+0)* Start 0,1 1 2 Start Linguagens sem contexto E  I | E+E | E×E | (E) I  a | b | Ia | Ib | I0 | I1 A B

Ideia Autómato de pilha é um -NFA com uma pilha de símbolos
Adiciona a possibilidade de memorizar uma quantidade infinita de informação Só tem acesso ao topo da pilha (LIFO), em vez de poder consultar qualquer posição de memória, como os computadores genéricos Funcionamento A parte de controlo lê e consome os símbolos da entrada Transição para novo estado baseada no estado corrente, símbolo de entrada e símbolo no topo da pilha Transição espontânea com  Topo da pilha substituído por cadeia Controlo de estados finito entrada Aceita/ rejeita pilha

Exemplo do palindroma Lwwr = {wwR | w em (0+1)*} palindromas de comprimento par Linguagem sem contexto gerada pela gramática P   | 0P0 | 1P1 Construir um autómato de pilha Estado inicial q0 significa que ainda não se atingiu o meio de wwR; vai-se guardando na pilha os símbolos de w A qualquer altura, adivinha-se que já se chegou ao meio (fim de w) e faz-se uma transição  para q1; a pilha contém w, a começar no fundo e a acabar no topo; o não determinismo é simulado pela manutenção dos dois estados Em q1 comparam-se os símbolos de entrada com o topo da pilha; se não houver correspondência, a aposta foi errada e este ramo da computação morre; outro poderá ter sucesso Se a pilha se esvaziar (e a entrada acabar) descobriu-se w e wR

Definição Autómato de pilha (PDA) P= (Q, , , , q0, Z0, F)
Q: conjunto finito de estados : conjunto finito de símbolos de entrada : alfabeto da pilha finito : função de transição (q, a, X) = {(p1,1), …} finito q é um estado, a um símbolo de entrada ou , X um símbolo da pilha p1 é o novo estado, 1 é a cadeia de símbolos da pilha que substitui X no topo 1=  pop do topo da pilha 1= X pilha inalterada 1= YZ X substituído por Z e push do Y a seguir q0: estado inicial Z0: símbolo inicial, conteúdo inicial da pilha F: conjunto de estados de aceitação ou finais

De novo o exemplo PDA de Lwwr P = ({q0,q1,q2}, {0,1}, {0,1,Z0}, , q0, Z0, {q2}) Z0 usado para marcar o fundo da pilha e permitir no fim da leitura de wwR passar para o estado de aceitação q2 (q0,0,Z0)= {(q0,0Z0)} e (q0,1,Z0)= {(q0,1Z0)} topo da pilha à esquerda (q0,0,0)= {(q0,00)}, (q0,0,1)= {(q0,01)}, (q0,1,0)= {(q0,10)}, (q0,1,1)= {(q0,11)} (q0,,Z0)= {(q1,Z0)}, (q0, ,0)= {(q1,0)}, (q0, ,1)= {(q1,1)} (q1,0,0)= {(q1, )} e (q1,1,1)= {(q1, )} (q1,,Z0)= {(q2,Z0)}

Diagrama de transição Nós são estados Start indica o estado inicial
0, Z0/0Z0 1, Z0/1Z0 0, 0/00 0, 1/01 1, 0/10 1, 1/11 0, 0/ 1, 1/ Start q0 q1 q2 , Z0/Z0 , 0/0 , 1/1 , Z0/Z0 Nós são estados Start indica o estado inicial Arcos correspondem às transições Etiqueta a,X/α de q para p significa que (q,a,X) contém (p,α) O arco indica a entrada e o topo da pilha antes e depois

Descrição instantânea
Computação de um PDA Evolui de configuração em configuração, em resposta a símbolos de entrada (ou ) e alterando a pilha Num DFA: toda a informação no estado; num PDA: estado + pilha Descrição instantânea (q,w,) q: estado w: entrada remanescente (em vez de só um símbolo, conveniência) : conteúdo da pilha (topo à esquerda) Passo de um PDA (Q, , , , q0, Z0, F) Se (q,a,X) contiver (p,α), para todas as cadeias w em * e  em * (q, aw, X) ├P (p,w,α) Usa-se ├* para zero ou mais passos (computação)

Ainda o exemplo Entrada w=1111
Descrição instantânea (DI) inicial: (q0, 1111, Z0) (q0, 1111, Z0) (q1, 1111, Z0) (q2, 1111, Z0) (q0, 111, 1Z0) (q1, 111, 1Z0) (q1, 11, Z0) (q2, 11, Z0) (q0, 11, 11Z0) (q1, 11, 11Z0) (q0, 1, 111Z0) (q1, 1, 111Z0) (q1, 1, 1Z0) (q1, , 11Z0) (q1, , Z0) (q2, , Z0) (q0, , 1111Z0) (q1, , 1111Z0)

Princípios relativos a DI
Se uma sequência de DIs (computação) é legal para um PDA P então a computação que resulta de adicionar uma qualquer cadeia w à entrada em cada DI também é legal Se uma computação é legal para um PDA P então a computação que resulta de adicionar um qualquer conjunto de símbolos abaixo da pilha em cada DI também é legal Teorema 1: Se (q,x,α) ├* (p,y,) então (q,xw,α) ├* (p,yw,) Se uma computação é legal para um PDA P e uma cauda da entrada não é consumida, então a computação que resulta de remover essa cauda da entrada em cada DI também é legal Teorema 2: Se (q,xw,α) ├* (p,yw,) então (q,x,α) ├* (p,y,)

Comentários Dados para os quais P nunca olha não podem afectar a sua computação Conceito semelhante à própria noção de linguagem sem contexto: o que está ao lado não influencia a computação Teorema 2 não é o inverso do 1 porque o que está na pilha pode influenciar a computação mesmo sem ser descartado Pode por exemplo ir sendo retirado da pilha um símbolo de cada vez e no último passo repor tudo

Linguagens de um PDA Aceitação por estado final Exemplo:
Seja o PDA P = (Q, , , , q0, Z0, F) Linguagem de P aceite por estado final L(P) = {w | (q0,w,Z0) ├* (q,,α)} e q  F Conteúdo final da pilha é irrelevante Exemplo: (q0,wwR,Z0) ├* (q0,wR,wRZ0) ├ (q1,wR,wRZ0) ├* (q1,,Z0) ├ (q2,,Z0) Aceitação por pilha vazia N(P) = {w | (q0,w,Z0) ├* (q,,)} Linguagem aceite por pilha vazia, conjunto de entradas w que P consome esvaziando ao mesmo tempo a pilha (N(P) – pilha nula) Mesmo exemplo: modificação para esvaziar a pilha e obter N(P)=L(P) (q1,,Z0)= {(q2,Z0)} passa a ser (q1,,Z0)= {(q2,)} (q0,wwR,Z0) ├* (q0,wR,wRZ0) ├ (q1,wR,wRZ0) ├* (q1,,Z0) ├ (q2,,)

Da pilha vazia ao estado final
Teorema: Se L = N(PN) para um PDA PN = (Q, , , N, q0, Z0) então existe um PDA PF tal que L = L(PF) Dois métodos de aceitação de uma entrada equivalentes Embora para um PDA P possa ser L(P)  N(P) Partindo de PN, usa-se um novo X0   como símbolo inicial de PF e como marcador do fundo da pilha: PF vê X0 quando pilha de PN vazia , X0/  , X0/  Start p0 q0 pf PN , X0/Z0X0 , X0/  PF = (Q{p0,pf}, , {X0}, F, p0, X0,{pf})

Do estado final à pilha vazia
, any/ , any/ Start p0 q0 p PF , X0/Z0X0 , any/

Exemplo de conversão Defina um PDA que processe sequências de “i” e “e”, significando if e else, construção presente em muitas linguagens de programação, detectando sequências inválidas (sequências que têm mais “e’s” que “i’s” num prefixo) Símbolo inicial Z; pilha com Zn significa que nº i’s - nº e’s = n-1 Aceitação por pilha vazia (balanço de mais um “e” que “i”) Conversão para aceitação por estado final e, Z/  i, Z/ZZ e, Z/  i, Z/ZZ Start q Start p q r , X0/ZX0 , X0/ pilha vazia Estado final

Equivalência entre PDAs e CFGs
Prova-se que as linguagens sem contexto, definidas por CFG, são as linguagens aceites por pilha vazia por um PDA e portanto também as aceites por estado final por um PDA Ideia: dada uma CFG G construir um PDA que simula as derivações mais à esquerda de G Qualquer forma frásica esquerda não terminal pode ser escrita como xAα, onde A é a variável mais à esquerda. Aα é a cauda. CFG G = (V,T,Q,S) PDA que aceita L(G) por pilha vazia: P = ({q}, T,VT,,q,S) Para cada variável A: (q,,A)={(q,) | A   é produção em G} Para cada terminal a: (q,a,a)={(q,)}

De CFG para PDA E  I | E+E | E×E | (E) I  a | b | Ia | Ib | I0 | I1
Dada a CFG Obter um PDA de aceitação por pilha vazia que aceite a mesma linguagem. PN = ({q}, {a,b,0,1,(,),+,×}, {a,b,0,1,(,),+,×,E,I}, , q, E) (q,,I) = {(q,a), (q,b), (q,Ia), (q,Ib), (q,I0), (q,I1)} (q,,E) = {(q,I), (q,E+E), (q,E×E), (q,(E))} (q,a,a) = {(q,)}; (q,b,b)={(q,)}, (q,0,0) = {(q,)}; (q,1,1) = {(q,)}; (q,(,() = {(q,)}; (q,),)) = {(q,)}; (q,+,+) = {(q,)}; (q,×,×) = {(q,)} Só um estado; processamento das variáveis espontâneo; só os terminais consomem entrada E  I | E+E | E×E | (E) I  a | b | Ia | Ib | I0 | I1

Exercício Usando a CFG e o PDA para a linguagem das expressões a) b)
a) obtenha uma derivação mais à esquerda de a(a+b00) b) obtenha o traço da respectiva computação no PDA, isto é, a sequência de Descrições Instantâneas a) E  E×E  I×E  a×E  a×(E)  a×(E+E)  a×(I+E)  a×(a+E)  a×(a+I)  a×(a+I0)  a×(a+I00)  a×(a+b00) b) (q, a(a+b00), E) ├ (q, a(a+b00), EE) ├ (q, a(a+b00), IE) ├ (q, a(a+b00), aE) ├ (q, (a+b00), E) ├ (q, (a+b00), E) ├ (q, (a+b00), (E)) ├ (q, a+b00), E)) ├ (q, a+b00), E+E)) ├ (q, a+b00), I+E)) ├ (q, a+b00), a+E)) ├ (q, +b00), +E)) ├ (q, b00), E)) ├ (q, b00), I)) ├ (q, b00), I0)) ├ (q, b00), I00)) ├ (q, b00), b00)) ├ (q, 00), 00)) ├ (q, 0), 0)) ├ (q,),)) ├ (q, , )

De PDA para CFG Ideia: reconhecer que o evento fundamental num processamento num PDA é o pop final de um símbolo da pilha enquanto se consome entrada Acrescentar variáveis na linguagem para Cada eliminação definitiva de um símbolo X da pilha Cada mudança de estado de p para q ao eliminar X, representada por um símbolo composto [pXq] Regra: do PDA P= (Q, , , N, q0, Z0) construir CFG G= (V, , R, S) Variáveis V: contém S e os símbolos [pXq]

De PDA para CFG (cont) Produções R:
Para todos os estados p, G contém S  [q0Z0p] O símbolo [q0Z0p] gera todas as cadeias w que extraem Z0 da pilha enquanto vão do estado q0 para o estado p, (q0,w,Z0) ├* (p,,) Então S gera todas as cadeias w que esvaziam a pilha Se (q,a,X) contém o par (r,Y1Y2…Yk), k0, a   ou a= então para todas as listas de estados r1,r2,…,rk, G contém [qXrk]  a[rY1r1][r1Y2r2]…[rk-1Ykrk] Uma forma de extrair X e ir de q a rk é ler a (pode ser ) e usar alguma entrada para extrair Y1 ao ir de r para r1, etc.

Exemplo Converter o PDA PN=({q},{i,e},{Z},N,q,Z) numa gramática
aceita as cadeias que violam pela 1ª vez a regra de que um “e” deve corresponder a um “i” precedente Solução: só um estado q e só um símbolo de pilha Z Duas variáveis: S, símbolo inicial; [qZq], único símbolo a partir dos estados e símbolos de PN Produções: S  [qZq] (se houvesse mais estados p e r teríamos S[qZp] e S[qZr]) De N(q,i,Z)={(q,ZZ)} obter [qZq]i[qZq] [qZq] (se houvesse mais estados p e r teríamos [qZp]i[qZr] [rZp]) De N(q,e,Z)={(q,)} obter [qZq]e (Z é substituído por nada) Chamando A a [qZq] fica SA e A  iAA | e

Propriedades das CFL Simplificação das CFGs  forma normal de Chomsky
Eliminação de símbolos inúteis Símbolo útil: S * αX * w, w  T* Símbolo gerador: X * w Qualquer terminal é gerador, dele próprio! Símbolo atingível: S * αX Útil = gerador + atingível Eliminar primeiro os não geradores e depois os não atingíveis Exemplo S  AB | a S  a [B não é gerador] S  a A  b A  b [A não é atingível]

Eliminação de símbolos inúteis
Algoritmo: descobrir os símbolos geradores os terminais são geradores A  α e α só tem geradores; então A é gerador Algoritmo: descobrir os símbolos atingíveis S é atingível A é atingível, Aα; então todos os símbolos em α são atingíveis

Eliminação de produções-
Variável anulável: A *  Transformação: B  CAD passa a B  CD | CAD e impede-se que A produza  Algoritmo: descobrir as variáveis anuláveis A  C1 C2 … Ck, todos os Ci são anuláveis; então A é anulável Se uma linguagem L tem uma CFG então L-{} tem uma CFG sem produções- Determinar todos os símbolos anuláveis Para cada A  X1 X2 … Xk se m Xi’s são anuláveis substituir por 2m produções com todas as combinações de presenças de Xi. Excepção: se m=k, não se inclui o caso de todos os Xi ausentes Produções A   são eliminadas

Exemplo Gramática A e B são anuláveis, logo S também S  AB | A | B
A  aAA |  B  bBB |  A e B são anuláveis, logo S também S  AB | A | B A  aAA | aA | aA | a B  bBB | bB | b

Eliminação de produções unitárias
Produção unitária: A  B, em que A e B são variáveis Podem ser úteis na eliminação de ambiguidade (ex: linguagem das expressões) Não são imprescindíveis; introduzem passos extra nas derivações Eliminam-se por expansão I  a | b | Ia | Ib | I0 | I1 F  I | (E) T  F | T × F E  T | E + T De E  T passar a E  F | T × F a E  I | (E) | T × F e finalmente E  a | b | Ia | Ib | I0 | I1 | (E) | T × F Problema no caso de ciclos

Eliminação de produções unitárias
Algoritmo: descobrir todos os pares unitários, deriváveis apenas com produções unitárias (A, A) é um par unitário (A, B) é um par unitário e B  C, C variável; então (A, C) é unitário Exemplo: (E, E), (T, T), (F, F), (E, T), (E, F), (E, I), (T, F), (T, I), (F, I) Eliminação: substituir as produções existentes de forma a que para cada par unitário (A, B) se incluam todas as produções da forma A  α em que B  α é uma produção não unitária (incluir A=B)

Gramática sem produções unitárias
I  a | b | Ia | Ib | I0 | I1 F  I | (E) T  F | T × F E  T | E + T Par Produções (E, E) E  E + T (E, T) E  T × F (E, F) E  (E) (E, I) E  a | b | Ia | Ib | I0 | I1 (T, T) T  T × F (T, F) T  (E) (T, I) T  a | b | Ia | Ib | I0 | I1 (F, F) F  (E) (F, I) F  a | b | Ia | Ib | I0 | I1 (I, I) I  a | b | Ia | Ib | I0 | I1

Sequência de simplificação
Se G é uma CFG que gera uma linguagem com pelo menos uma cadeia diferente de , existe uma CFG G1 que não tem produções-, produções unitárias ou símbolos inúteis e L(G1) O= L(G) – {} Eliminar produções- Eliminar produções unitárias Eliminar símbolos inúteis

Forma normal de Chomsky (CNF)
Todas as CFL sem  têm uma gramática na forma normal de Chomsky: sem símbolos inúteis e em que todas as produções são da forma A  BC (A, B, C variáveis) ou A  a (A variável e a terminal) Transformação Começar com uma gramática sem produções-, produções unitárias ou símbolos inúteis Deixar as produções A  a Passar todos os corpos de comprimento 2 ou mais para só variáveis Variáveis novas D para os terminais d nesses corpos, substituir e D  d Partir corpos de comprimento 3 ou mais em cascatas de produções só com 2 variáveis A  B1B2…Bk para AB1C1, C1B2C2, …

Gramática das expressões
Variáveis para os terminais em corpos não isolados A  a B  b Z  0 O  1 P  + M  × L  ( R  ) E  EPT | TMF | LER | a | b | IA | IB | IZ | IO T  TMF | LER | a | b | IA | IB | IZ | IO F  LER | a | b | IA | IB | IZ | IO I  a | b | IA | IB | IZ | IO Substituir corpos compridos E  EC1 | TC2 | LC3 | a | b | IA | IB | IZ | IO T  TC2 | LC3 | a | b | IA | IB | IZ | IO F  LC3 | a | b | IA | IB | IZ | IO C1  PT C2  MF C3  ER

Lema da bombagem para CFL
Dimensão de uma árvore de análise Considerar apenas o caso das CNF: árvores binárias em que as folhas são terminais sem irmãos (produções Aa) Numa gramática com árvore de análise CNF e colheita w terminal, se o comprimento do maior caminho for n então |w|  2n-1 Seja L uma CFL. Existe uma constante n tal que, para qualquer cadeia z em L com |z|n se pode escrever z=uvwxy |vwx|  n a parte do meio não é demasiado comprida vx   pelo menos uma é não vazia Para todo i  0, uviwxiy  L bombagem dupla, a começar em 0

Prova Obter uma gramática CNF G para L
G contém m variáveis. Escolher n=2m. Cadeia z em L |z|  n. Qualquer árvore de análise com caminho mais longo de comprimento até m tem colheita até 2m-1=n/2. z seria demasiado longa; árvore para z tem caminho m+1 ou maior Na figura, o caminho A0…Aka é de comprimento k+1, km Há pelo menos m+1 variáveis no caminho; logo há pelo menos uma repetição de variáveis (de Ak-m a Ak). Supõe-se Ai=Aj com k-m  i < j  k

Continuação da prova Se cadeia z suficientemente longa, tem que haver repetições de símbolos Divide-se a árvore: w é a colheita da subárvore de Aj v e x são tais que vwx é a colheita de Ai (como não há produções unitárias pelo menos um de v e x é não nulo) u e y são as partes de z à esquerda e à direita de vwx A0 Ai=Aj Aj Ak a u v w x y z

Continuação da prova Como Ai=Aj, pode-se
substituir a subárvore de Ai pela de Aj, obtendo o caso i=0, uwy. substituir a subárvore de Aj pela de Ai, obtendo o caso i=2, uv2wx2y e repetir para i=3, … (bombagem) |vwx|n porque se pegou num Ai próximo do fundo da árvore, k-im, caminho mais longo de Ai até m+1, colheita até 2m=n A A u v w x y S S A A w A u y u v x y A v w x

Lema da bombagem LR (DFA) CFL (CFG) no caso das LR: o lema da bombagem decorre de o número de estados de um DFA ser finito para aceitar uma cadeia suficientemente comprida tem que haver repetições de estados No caso das CFL: decorre de o número de símbolos numa CFG ser finito para aceitar uma cadeia suficientemente comprida tem que haver repetições (“duplas”) de símbolos

Provar que uma linguagem não é CFL
Seja L = {0k1k2k | k  1}. Mostre que não é CFL. Supondo que L é uma CFL, existe uma constante n indicada pelo lema da bombagem; tome-se z = 0n1n2n que faz parte de L Fazendo z=uvwxy, sujeito a |vwx|  n e v, x não ambos nulos, temos que vwx não pode conter simultaneamente 0’s e 2’s Caso vwx não contém 2’s; então vx tem só 0’s e 1’s e tem pelo menos um símbolo. Então, pelo lema da bombagem, uwy também deveria pertencer à linguagem. Mas tem n 2’s e menos do que n 0’s ou 1’s e portanto não pertence à linguagem. Caso vwx não contém 0’s: argumento semelhante. Obtém-se contradição em ambos os casos; portanto a hipótese é falsa e L não é uma CFL

Problemas na prova Seja L = {0k1k | k  1}. Mostre que não é CFL.
Supondo que L é uma CFL, existe uma constante n indicada pelo lema da bombagem; tome-se z = 0n1n que faz parte de L Fazendo z=uvwxy, sujeito a |vwx|  n e v, x não ambos nulos, pode acontecer de escolher v= 0k e x=1k Neste caso uviwxiy pertence sempre a L. Não se obtém a contradição pretendida Não se consegue provar que L não é CFL De facto é uma CFL

Substituição Seja  um alfabeto; para cada um dos seus símbolos a define-se uma função (substituição) que associa uma linguagem La ao símbolo Cadeias: se w= a1…an então s(w) é a linguagem de todas as cadeias x1…xn tais que xi está em s(ai) Linguagens: s(L) é a união de todos as s(w) tais que w  L Exemplo: ={0,1}, s(0)={anbn | n1}, s(1)={aa,bb} Se w=01, s(w) = s(0)s(1) = {anbnaa | n1}  {anbn+2 | n1} Se L=L(0*), s(L) = (s(0))* = an1bn1…ankbnk, para n1, …, nk qq Teorema: seja L uma CFL e s() uma substituição que associa a cada símbolo uma CFL; então s(L) é uma CFL.

Aplicação do teorema da substituição
As CFL são fechadas para: União Concatenação Fecho (*) e fecho positivo (+) Homomorfismo Reverso Intersecção com uma LR Intersecção com uma CFL não é garantida Homomorfismo inverso

CFL e intersecção Seja L1 = {0n1n2i | n1, i1} e L2 = {0i1n2n | n1, i1} L1 e L2 são CFL S  AB S  AB A  0A1 | 01 A  0A | 0 B  2B | 2 B  1B2 | 12 L1  L2 = {0n1n2n | n1} Já está provado que não é CFL Logo as CFL não são fechadas para a intersecção

Complexidade das conversões
Conversões lineares no comprimento da representação CFG para PDA PDA de estado final para PDA de pilha vazia PDA de pilha vazia para PDA de estado final Conversão O(n3) PDA para CFG (tamanho da CFG também O(n3)) Conversão O(n2) CFG para CNF (tamanho da CNF também O(n2))

Propriedades de decisão das CFL
Teste de linguagem vazia Verificar se S é gerador Com estrutura de dados adequada, O(n) Teste de pertença numa CFL O(n3), usando programação dinâmica, preenchimento de tabela S  AB | BC A  BA | a B  CC | b C  AB | a w=baaba X15 X14 X25 X13 X24 X35 X12 X23 X34 X45 X11 X22 X33 X44 X55 a1 a2 a3 a4 a5 {S,A,C} {B} {S,A} {S,C} {A,C} b a X12: X11X22; X24: X22X34X23X44

Problemas não decidíveis
Não há algoritmo para responder a estas perguntas Uma dada CFG é ambígua? Uma dada CFL é inerentemente ambígua? A intersecção de duas CFL é vazia? Duas CFL dadas são a mesma linguagem? Uma CFL é o “universo” *, em que  é o seu alfabeto?

Computabilidade e Linguagens Formais

Apresentações semelhantes

Apresentação em tema: "Computabilidade e Linguagens Formais"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback

Login

Autorizar-se através da rede social:

Computabilidade e Linguagens Formais

Apresentações semelhantes

Apresentação em tema: "Computabilidade e Linguagens Formais"— Transcrição da apresentação:

Apresentações semelhantes

Sobre projeto

Feedback