Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouAndré Cassis Alterado mais de 9 anos atrás
1
Blocos básicos e Traces Departamento de Estatística e Informática Universidade Federal de Sergipe Compiladores Giovanny Lucero giovanny@ufs.br
2
Adequação de Tree Alguns aspectos de Tree não tem correspondência com linguagens de máquina –CJUMP tem dois rótulos Ordem de avaliação de expressões interfere com otimização –Sem ESEQ e CALL, ordem de avaliação não importa
3
Transformação em três passos Trees canônicos sem SEQ ou ESEQ –Subindo SEQ e ESEQ ao topo da árvore –Todo pai de SEQ é um SEQ –Portanto, substituímos os SEQs por uma lista de Tree.Stm Agrupação em blocos sem JUMPS internos ou rótulos (Blocos Básicos) Traces: c/CJUMP seguido imediatamente pelo seu rótulo false
4
Árvores Canônicas Não tem SEQ nem ESEQ O pai de cada CALL é – EXP(...) ou MOVE(Temp t,...)
5
Regras de transformação ESEQ s1 s2e ESEQ SEQ e s1 s2 ESEQ(s1,ESEQ(s2,e)) = ESEQ(SEQ(s1,s2),e)
6
BINOP op ESEQ s1 e1 e2 BINOP op ESEQ s1 e1 e2 BINOP(op, ESEQ(s1,e1),e2) = ESEQ(s1, BINOP(op, e1,e2)) MEM(ESEQ(s,e1)) = ESEQ(s,MEM(e1)) JUMP(ESEQ(s,e1) = SEQ(s,JUMP(e1) CJUMP(op,ESEQ(s,e1),e2,L1,L2) = SEQ(s,CJUMP(op,e1,e2,L1,L2))
7
BINOP(op,e1,ESEQ(s1,e2)) = ESEQ(s1, BINOP(op,e1,e2)) BINOP op ESEQ s1 e2 e1 ESEQ s1 BINOP e1 e2 Está correto? op
8
BINOP(op,e1,ESEQ(s1,e2)) = ESEQ(s1, BINOP(op,e1,e2)) BINOP op ESEQ s1 e2 e1 Está correto? Não em todos os casos. s1 pode realizar alguma ação que modifique o valor de e1. ESEQ s1 BINOP e1 e2 op
9
BINOP(op,e1,ESEQ(s1,e2)) = ESEQ(MOVE(TEMP t, e1), ESEQ(s1, BINOP(op, TEMP t, e2) BINOP op ESEQ s1 e2 e1 ESEQ MOVE ESEQ s1 BINOP Solução Criar um temporário t. TEMP t e1 op e2TEMP t
10
CJUMP(op,e1,ESEQ(s,e2),L1,L2) = SEQ(MOVE(TEMP t,e1), SEQ(s, CJUMP(op,TEMP t,e2,L1,L2)))
11
Se s e e1 comutam: BINOP(op,e1,ESEQ(s,e2)) = ESEQ(s,BINOP(op,e1,e2)) CJUMP(op,e1,ESEQ(s,e2),L1,L2) = SEQ(s, CJUMP(op,e1,e2,L1,L2) ) Observe que s e e1 comutam se s não produz efeitos colaterais que alterem e1 –Dados de e1 não são referenciados por s –Não podemos saber sempre se duas expressões comutam. MOVE(MEM(x),y) e MEM(z) –Tomamos uma abordagem conservadora NAME(L) e CONST(n) comutam com todo mundo.
12
CALL Regras similares são aplicadas a CALL quando seu pai não é MOVE ou EXP. Exemplo: –BINOP(PLUS, CALL(...), CALL(...)); CALLs devolvem resultados em um mesmo registrador. (Sobrescrita).
13
CALL Para resolver este problema, substituir cada ocorrência de CALL por: –ESEQ(MOVE(TEMP t new, CALL(...), TEMP t new ).
14
Linearização dos Statements Após execução destes passos, todos os SEQ estarão próximos a raiz da árvore. No entanto podemos encontrar construções desta forma: –SEQ(SEQ(a,b), c)). Para eliminarmos estas construções, aplicamos novas transformações tal que: –SEQ(SEQ(a,b),c) = SEQ(a, SEQ(b, c)). Agora sim, podemos eliminar os construtores SEQ.
15
Transformação em três passos Trees canônicos sem SEQ ou ESEQ –Subindo SEQ e ESEQ ao topo da árvore –Todo pai de SEQ é um SEQ –Portanto, substituímos os SEQs por uma lista de Tree.Stm Agrupação em blocos sem JUMPS internos ou rótulos (Blocos Básicos) Traces: c/CJUMP seguido imediatamente pelo seu rótulo false
16
Blocos Básicos Em um bloco básico: –O primeiro comando é um rótulo –O último comando é um JUMP ou CJUMP –Não há mais rótulos JUMPS ou CJUMPS Algoritmo: –scanear o programa Tree assim: Se um rótulo é achado, começa um novo bloco Se um (C)JUMP é achado, termina o bloco Se ficou algum bloco não finalizado por (C)JUMP, adicione um JUMP para o próximo bloco Se ficou algum bloco sem começar com rótulo, invente um novo rótulo
17
Transformação em três passos Trees canônicos sem SEQ ou ESEQ –Subindo SEQ e ESEQ ao topo da árvore –Todo pai de SEQ é um SEQ –Portanto, substituímos os SEQs por uma lista de Tree.Stm Agrupação em blocos sem JUMPS internos ou rótulos (Blocos Básicos) Traces: c/CJUMP seguido imediatamente pelo seu rótulo false
18
Traces Observe que os blocos básicos podem ser re-arranjados em qualquer ordem sem alterar a semântica do programa Escolhemos um ordenamento de blocos tal que c/CJUMP é seguido por seu rótulo falso, e Se possível, JUMPs seguido imediatamente do seu rótulo alvo
19
Traces Algoritmo: –Enquanto existir blocos não marcados. Comece com qualquer bloco (marque o bloco) Siga o possível caminho de execução (JUMP), marcando os blocos percorridos. Se CJUMP() escolha um dos dois caminhos. Ligue os blocos percorridos (trace gerado).
20
Traces Finalizando: –Qualquer CJUMP imediatamente seguido pelo seu rótulo “false”. Deixe como está. –Qualquer CJUMP imediatamente seguido pelo seu rótulo “true”. Trocamos o rótulo true por false e negamos a condição.
21
Traces –Qualquer CJUMP(cond, a, b, lt, lf) seguido nem por true ou false. Rescrevemos o CJUMP para a seguinte forma: –CJUMP(cond, a, b, lt, l’f) –LABEL l’f –JUMP(NAME lf);
22
Seleção de instrução Departamento de Estatística e Informática Universidade Federal de Sergipe Compiladores Giovanny Lucero giovanny@ufs.br
23
Padrões Tree Identificamos uma instrução de máquina como um fragmento de Tree (um padrão) Tiling: recortamos a árvore em um mosaico/“quebra cabeças” de padrões –Objetivo: obter um conjunto “otimizado” de padrões.
24
Padrões para Jouette – r_iTEMP ADD r_i ← r_j + r_k MUL r_i ← r_j × r_k SUB r_i ← r_j - r_k DIV r_i ← r_j / r_k ADDI r_i ← r_j + c SUBI r_i ← r_j - c + × - / + CONST + - Em jouette o registrador 0 sempre contém 0
25
LOAD r_i ← M[r_j+c] STORE M[r_j+c] ← r_i MOVEM M[r_i] ← M[r_j] MOVE MEM + CONST MOVE MEM + CONST MOVE MEM CONST MOVE MEM + CONST MEM + CONST MEM CONST MOVE MEM
26
TEMP i Tiling árvores MOVE MEM + + fp CONST x MEM* CONST 4 + fp CONST a a[i]:=x
27
Tiling árvores MOVE MEM + + fp CONST x MEM* TEMP i CONST 4 + fp CONST a fp 2. LOAD r_1 ← M[fp+a] 4. ADDI r_2 ← r_0 + 4 5. MUL r_2 ← r_i × r_2 6. ADD r_1 ← r_1 + r_2 8. LOAD r_2 ← M[fp+x] 9. STORE M[r_1+0] ← r_2 a[i]:=x 1 2 3 4 5 6 7 8 9
28
fp TEMP i Tiling árvores MOVE MEM + + fp CONST x MEM* CONST 4 + CONST a MOVE MEM + + fp CONST x MEM* TEMP iCONST 4 + fp CONST a a[i]:=x 1 2 3 4 5 6 7 8 9 2. LOAD r_1 ← M[fp+a] 4. ADDI r_2 ← r_0 + 4 5. MUL r_2 ← r_i × r_2 6. ADD r_1 ← r_1 + r_2 8. LOAD r_2 ← M[fp+x] 9. STORE M[r_1+0] ← r_2 9. MOVEM M[r1] ← M[r2] X X X X
29
Tilings ótimos e “otimais” C/instrução de máquina tem um custo (tempo de execução) Ótimo soma dos custos dos tiles é mínima Otimal não existe nenhum par de tiles adjacentes que possam ser combinados em um único tile mais eficiente Ótimo Ótimal, mas não viceversa Para RISC otimal e ótimo não são muito diferentes Para CISC nota-se às vezes a diferença
30
Maximal Munch Algoritmo top-down que calcula tiling otimal –Começando pela raiz, sempre escolha o tile maior que puder –Continue top-down com as sub-árvores ainda sem cobrir –Por c/tile colocado, gere as instruções correspondentes Gera instruções em ordem inversa Se todas as instruções têm o mesmo peso, o tile maior é o que tem mais nós.
31
Tiling Ótimo O algoritmo usa programação dinâmica: encontra a solução ótima baseada nas soluções ótimas de cada subproblema –Tiling ótimo de uma árvore é baseado no tiling ótimos das sub-árvores Associa com cada nó um custo –a soma dos custos do conjunto de instruções ótimo para sua sub-árvore Trabalha bottom-up
32
Exemplo CONST1 só é casado por ADDI e tem custo 1 Similarmente CONST2 Para + temos: MEM + CONST1CONS2 TileInstruçãoCusto tileCusto folhas Custo total ADD11+13 ADDI112 112 + + CONST +
33
Para MEM temos TileInstruçãoCusto tileCusto folhas Custo total LOAD123 112 112 MEM CONST + MEM CONST + MEM + CONST1CONS2
34
Emissão de código Uma vez calculado o custo da raiz (e assim da árvore inteira), emitimos o código assim emission(n): para cada folha l do tile t selecionado para n faça emission(l); emita o código para t
35
Emissão de código O código emitido para o exemplo é ADDI r_1 ← r_0+1 observe que não é gerado código para o nó + MEM + CONST1CONS2
36
Emissão de código O código emitido para o exemplo é observe que não é gerado código para o nó + MEM + CONST1CONS2 ADDI r_1 ← r_0+1 LOAD r_1 ←M[r_1+2]
37
Complexidade dos Algoritmos Tanto maximal munch como programação dinâmica tem complexidade linear. Porém a constante do maximal munch é bem menor. –Detalhes no livro do tigre Na prática esta fase é muito eficiente se comparada com outras do compilador.
38
Geradores de geradores Existem ferramentas que geram automaticamente um gerador de código –Recebem como entrada a especificação dos Tiles usando gramáticas –Para cada regra da gramática é associado um custo e uma ação específica. Custos são usados para encontrar o Tiling ótimo. Ações das regras casadas são usadas na fase de emissão.
39
39 Análise de Liveness Departamento de Estatística e Informática Universidade Federal de Sergipe Compiladores Giovanny Lucero giovanny@ufs.br
40
40 Longevidade (Liveness) Tradução para código intermediário assume um número ilimitado de temporários Máquinas têm um número limitado de registradores Dois temporários cabem num registrador se eles não são usados ao mesmo tempo Excessos de temporários devem ser armazenados em memória Análise de Liveness é uma tarefa prévia a alocação de registradores –Baseado no grafo de fluxo de controle a está vivo (live) sse contém um valor necessário no futuro
41
41 a ← 0 L1:b ← a + 1 c ← c + b a ← b * 2 if a < N goto L1 return c a:=0 b := a+1 c := c+b a := b*2 a < N return c Grafo de fluxo de controle 1 2 3 4 5 6 b está viva em 3→4 e 2→3 a em 1 → 2 e 4 → 5 → 2, mas não em 3 → 4 c em todo o programa Análise de liveness é feita de trás para frente
42
42 Definições definição = ocorrência no lado esquerdo de uma atribuição uso = no lado direito def(a)={n| n define a} (a é variável e n nó) def(n)={a| n define a} Similarmente definimos use(a) e use(n) Liveness: –Uma variável está viva numa aresta se há um caminho dirigido desde esta aresta até um nó que a usa e que não passa por nós que a definem –Uma variável está viva num nó se ela está viva em alguma aresta que entra neste nó –Uma variável vive fora de um nó se está viva em alguma aresta de saída
43
43 Liveness estático vs. dinâmico a:=b*b c := a+b c<=b return a 1 2 3 45 return c Note que o nó 4 nunca é alcançado. Logo a não está vivo fora de 2 (liveness dinâmico). Obs. dinâmico estático Infelizmente, liveness dinâmico é indecidível. Liveness estático é suficiente para realizar boas otimizações
44
44 Interferência entre variáveis Análise de liveness é útil para otimizações mas principalmente para alocação de registradores Duas variáveis se interferem se não podem ser alocadas num mesmo registrador –a e b estão vivas na mesma instrução –b está viva numa instrução que define a há um caso particular para instruções MOVE t s (copia)... x ... s... (uso de s)... y ... t... (uso de t) t e s não se interferem
45
45 Grafos de interferência Grafo de interferências –os nós são as variáveis –aresta de a para b se a e b se interferem
46
46 Grafos de interferência
47
47 Alocação de Registradores Departamento de Estatística e Informática Universidade Federal de Sergipe Compiladores Giovanny Lucero giovanny@ufs.br
48
48 Alocador de registradores Atribui aos temporários um número pequeno de registradores Atribui uma locação de memória quando não é possível atribuir um registrador Se possível atribui o mesmo registrador a mais de um temporário.
49
49 Se reduz ao problema do coloreamento de grafos –Colorir o grafo de interferências (onde os nós são os temporários) –1 cor por registrador (K registradores K cores) –nós adjacentes devem ter cores diferentes –o coloreamento se corresponde com uma atribuição de registradores que satisfaz as interferências –Se não houver coloreamento, alguns temporários são alocados em memória (spilling) O problema é NP-Completo Boa aproximação em tempo linear Alocador de registradores
50
50 Coloreando por simplificação Cinco fases: Build, Simplify, Spill, Select e Start Over Build –Construa o grafo de interferências (análise de dataflow) Simplify (heurística simples) –Se grau(n) < k coloreie G’ e então pinte n com uma cor diferente dos seus vizinhos (implementado com uma pilha de nós). Spill –Se todos os nós tem grau ≥ k escolha um nó candidato a eliminação (alocação em memória). Seja otimista e empilhe.
51
51 Coloreando por simplificação Select: começando pelo grafo totalmente descolorido desempilhe nós um por um e então faça: Se o nó foi empilhado pela condição grau(n)<K, pinte de uma cor diferente dos vizinhos Se foi candidato a eliminação, confira se o spilling é realmente preciso (pode ser que vizinhos repitam cores). Pinte se não houver spilling real. Se houver spilling real continue o select identificando outros spillings reais. Start Over –Se o Select detectou spillings reais, reescreva o programa, pegando os valores da memória antes de c/uso e atualizando a memória a c/ definiçao. –Repita o processo todo novamente
52
52 Exemplo Build
53
53 Exemplo Escolhemos um nó de grau <= k e empilhamos Simplify/ Spill
54
54 Exemplo Pilha Simplify/ Spill
55
55 X Select
56
56 X X Select
57
57 Select
58
58 Coalescer Eliminar redundantes MOVEs –se a e b não se interferem MOVE a b pode ser eliminado, juntando a e b em um único nó –O grafo resultante pode não ser k-colorável Estratégia Briggs: (não altera a k-coloração) –a e b podem ser coalescidos se o nó resultante ab tem menos que k vizinhos com grau significativo (≥ k arestas) Estratégia George: (não altera a coloração) –a e b podem ser coalescidos se para todo vizinho t de a, ou t interfere b ou t tem grau insignificante
59
59 Coloreamento com Coalescimento Build –Construa o grafo de interferências. Categorize os nós como “MOVE” e “não MOVE” Simplify –Empilhe só nós “não MOVE” de grau < k Coalesce –Usar George e Briggs no grafo reduzido obtido da simplificação –Faça simplify e coalesce até sobrar só nós “MOVE” ou de grau significante Freeze –Não é possível simplify ou coalesce, escolha um nó move de baixo grau. “Congele” os MOVEs deste nó. Volte. Spill e Select como antes
60
60 Build Simplify Coalesce Freeze Potential spillSelect Actual spill
61
61 Quais temporários são MOVE?
62
62 Quais temporários são MOVE?
63
63 Exemplo Pilha Neste momento posso pensar em coalescer (unir os nós) c e d possuem somente dois vizinhos de grau significante ( Briggs)
64
64 Exemplo Mais alguém?
65
65 Exemplo
66
66 Exemplo
67
67 Nós Pré-coloridos Frame pointer, registradores standard para argumentos, etc. Select e Coalesce podem dar a um temporário ordinário a cor de um pré-colorido sempre que não haja interferência Nós pré-coloridos não podem passar pela fase simplify (não podemos escolher a cor) Nunca fazemos spilling de pré-coloridos
68
68 Cópias temporárias de registradores Como pré-coloridos não são spilled, o front- end deve cuidar que a vida destes seja curta
69
69 Registradores caller-save e calle-save Instrução CALL interfere com todos os registradores caller-save –Se uma variável não sobrevive além de um procedimento, a tendência é coloca-lo num registrador caller-save –Caso contrário, ela fica em um calle-save.
70
Acabou!!!
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.