1.3 – Interpretadores – Compiladores versus Interpretadores

Slides:



Advertisements
Apresentações semelhantes
2008 LCG/UFRJ. All rights reserved. 1 Standard Template Library STL Claudio Esperança Paulo Roma Cavalcanti.
Advertisements

Banco de Dados Aula 01: Conceitos Básicos
SISTEMA BINÁRIO Hardware de Computadores. SISTEMA BINÁRIO Hardware de Computadores.
Técnicas e Projeto de Sistemas
PGF5001 – Mecânica Quântica 1 Prof. Emerson Passos.
Técnicas e Projeto de Sistemas
Grupo Paralelismo – Unesp RC
FORTRAN 90 Denise Yumi Takamura.
Modularização de Código. Modularizar código Construção do algoritmo em um módulo único (Início...Fim/ Program... End) Único arquivo.
Introdução ao Fortran 4/abril/2006. Pseudocódigo Compreensão do problema Elaboração da lógica de resolução Tradução da lógica para pseudocódigo.
Introdução à Lógica de Programação
Sistemas Operacionais
Utilização do montador Daedalus
Prototipação de um Interpretador para IMP com ML Juliana Vizzotto Júlio Machado Fevereiro 2002.
Algoritmos com laços (ou seja, com conjuntos de instruções que devem ser executados repetidas vezes)
Teste Estrutural de Software
Análise e Solução de Problemas
(Como implementar multiplicação e divisão uma vez só :-)
Algoritmos com Seleção
Slide 1 Rede Nacional de Ensino e Pesquisa Treinamento em Gradep - junho 2005 Serviço ContextManager Treinamento no GRADEp Framework Master-Worker.
Servidores e Programação Web Redes de Computadores.
Profa. Graziela Santos de Araújo Algoritmos e Programação II, 2010
Introdução A fim de preparar a geração de código, deve-se relacionar o fonte estático do programa às ações em tempo de execução. Durante a execução, o.
Geração de Código Otimizações independentes de máquina.
Geração de Código Cap. 8. Introdução Fase final para um compilador Entrada é uma representação intermediária do código fonte e a saída é um programa para.
Templates e Questões de Design Programas são geralmente construídos segundo um design que é relativamente bem mapeado nos mecanismos oferecidos pela linguagem.
Funções de um computador
CES-11 LAB 03 Bitmap Quadtree
CES-41 COMPILADORES Capítulo IV Complementos de Análise Léxica.
Capítulo VII – Tipos Enumerativos e Estruturas 7.1 – Tipos enumerativos 7.2 – A necessidade de estruturas 7.3 – Manipulação dos campos de uma estrutura.
CES-10 INTRODUÇÃO À COMPUTAÇÃO Aulas Práticas – 2013 Capítulo III Comandos de Controle.
CES-41 COMPILADORES Capítulo VII Código Intermediário.
CES-41 COMPILADORES Aulas Práticas
Capítulo VI – Variáveis Indexadas
CES-10 INTRODUÇÃO À COMPUTAÇÃO Aulas Práticas – 2013 Capítulo VII Variáveis Indexadas Numéricas.
CES-10 INTRODUÇÃO À COMPUTAÇÃO Capítulo XI Noções de Estruturas de Dados.
CES-10 INTRODUÇÃO À COMPUTAÇÃO Aulas Práticas – 2013 Capítulo XI Encadeamento de Estruturas por Ponteiros.
Capítulo IX – Ponteiros 9.1 – Introdução 9.2 – Relação entre ponteiros e variáveis indexadas 9.3 – Alocação dinâmica de memória 9.4 – Variáveis indexadas,
Capítulo III Diagramas de Transições
Capítulo V Análise Sintática
CES-41 COMPILADORES Capítulo I Introdução.
TA 733 A – Operações Unitárias II
Curso Técnico em Informática La Salle - Canoas
Trabalho de Formatura Supervisionado – MAC499 Aluno: Danilo Toshiaki Sato Orientador: Marco Dimas Gubitoso Estágio: Mai/2002 – Dez/2003.
EEL170 COMPUTAÇÃO I Antonio Cláudio Gómez de Sousa 1a série de slides versão 19/03/2012.
ARQUITETURA DE COMPUTADORES SOFTWARE PROGRAMA SEQUENCIA DE INSTRUÇÕES
Aritmética de ponto flutuante Erros
Representações na base decimal e binária
Organização de Sistemas de Computadores
Desempenho A rápida taxa de melhoria na tecnologia de computadores veio em decorrência de dois fatores: avanços na tecnologia utilizada na construção.
UERJ - Agosto 2000© Oscar Luiz Monteiro de Farias1 Bancos de Dados Mestrado em Engenharia de Computação área de concentração Geomática.
C/C++.
Laboratório de Programação Prof. Oscar Luiz Monteiro de Farias
Laboratório de Programação Prof. Oscar Luiz Monteiro de Farias
Laboratório de Programação Prof. Oscar Luiz Monteiro de Farias
Prof. Giovanny Lucero Introdução Prof. Giovanny Lucero
Classificação Interna de Dados Estrutura de Dados I Prof. Mai-Ly Vanessa Campus Prof. Alberto Carvalho - UFS.
Tecnologia para Web JavaScript Enrique Pimentel Leite de Oliveira
Recursividade Estrutura de Dados.
Marco Antonio Montebello Júnior
Entendendo as definições de classe
Curso de Programação em C++
Curso de Programação em C++ Universidade Federal do Ceará Departamento de Engenharia Estrutural e Construção Civil Prof: Evandro Parente Junior Monitor:
Baseado no documento do Prof. Ronaldo Martins da Costa
LINGUAGENS DE PROGRAMAÇÃO
04:27 Introdução Tipos de Fluxo de Dados e de Arquivos Manipulação de Arquivos em Java Classes FileReader e FileWriter Classes FileInputStream e FileOutputStream.
Computação Gráfica Geometria de Transformações
Introdução Ciência da Computação estudo de algoritmos –ÊNFASE ao estudo de DADOS armazenamento manipulação refinamento (a partir de dados cru) estrutura.
Sistemas Operacionais
1 Static Metaprogramming In C++ K. CZARNECKI e U. EISENECKER Universidade Federal de Santa Catarina Centro Tecnológico Departamento de Informática e Estatística.
Transcrição da apresentação:

1.3 – Interpretadores 1.3.1 – Compiladores versus Interpretadores Execução de um programa gerado por compilador: Dados Compilador + Montador Programa em linguagem de máquina Programa fonte Resultados Em tempo de compilação Em tempo de execução

Módulo de análise e armazena-mento Programa numa estrutura interna Execução de um programa interpretado: O interpretador faz análise léxica, sintática e semântica do programa-fonte, armazenando-o numa estrutura interna Em seguida, ele percorre a estrutura interna, executando as operações ali especificadas, consumindo os dados por elas pedidos Dados Interpretador Módulo de análise e armazena-mento Programa numa estrutura interna Módulo de execução Programa fonte Resultados Em Tempo de execução

Módulo de análise e armazena-mento Programa numa estrutura interna Execução de um programa interpretado: Não há criação de um programa em linguagem de máquina equivalente ao programa-fonte O único programa executado é o interpretador Dados Interpretador Módulo de análise e armazena-mento Programa numa estrutura interna Módulo de execução Programa fonte Resultados Em Tempo de execução

Exemplo: seja o comando de atribuição v1 = v2 + v3 * v4; Um interpretador pode construir-lhe uma árvore de execução (estrutura interna): = Depois ele caminha pela árvore, executando as operações

Na raiz, ele faz uma atribuição da expressão do lado direito à variável do lado esquerdo No cálculo dessa expressão, ele soma a variável do lado esquerdo com a expressão do lado direito (chamada recursiva do cálculo de expressão) =

Há interpretadores de código fonte e de código intermediário Interpretador de código fonte: Deve haver uma forma de armazenamento do programa fonte Interpretador de código intermediário: o código intermediário pode ser gerado pelo mesmo processo usado nos compiladores

1.3.2 – Interpretadores de código-fonte Durante a análise sintática, o programa-fonte é armazenado numa estrutura denominada árvore do programa Depois, essa estrutura é percorrida, para que os comandos do programa sejam executados Exemplo: programa para o Bubble-Sort

Sua árvore de armazenamento void main () { int n, i, p, aux, vetor[50]; char trocou; read (n); for (i=0; i<n; i++) read (vetor[i]); trocou = 1; for (p = n-2; p>=0 && trocou == 1; p--) { trocou = 0; for (i = 0; i<=p; i++) if (vetor[i] > vetor[i+1]) { aux = vetor[i]; vetor[i] = vetor[i+1]; vetor[i+1] = aux; } write (vetor[i]); Sua árvore de armazenamento

As declarações podem ser eliminadas

Cada nó retangular pode ser mais detalhado

Cada nó retangular pode ser mais detalhado Ver detalhes

Cada nome de variável deve ser substituído por um ponteiro para sua posição na tabela de símbolos Lá deve haver um campo para guardar seu valor

Interpretação de código fonte é muito ineficiente Os programas costumam ter muitos aninhamentos Cada tipo de comando é executado por um módulo específico

O módulo de um comando repetitivo irá chamar os módulos dos comandos de seu escopo Se um deles for um comando condicional, ocorrerá com ele o mesmo Num dado momento, poderão estar ativas várias versões de diversos módulos

Há consumo de muita memória e sobrecarga de trabalho para gerenciá-la Os interpretadores de código intermediário são os preferidos No entanto, o conceito de árvore de programa é muito útil em softwares que fazem análise do programa-fonte Por exemplo, em compiladores paralelos, a detecção de paralelismo exige análise de dependências que só pode ser feita se o programa-fonte estiver apropriadamente armazenado

1.3.3 – Interpretadores de código intermediário Podem ter os mesmos componentes da frente de um compilador convencional: Analisadores léxico, sintático e semântico Gerador de código intermediário Otimizador de código intermediário Além desses, devem ter o componente que vai fazer a interpretação propriamente dita do código intermediário Esse componente percorre o código, executando as operações ali especificadas e processando os dados por elas solicitados

Exemplo: laço do programa anterior: for (i = 0; i<=p; i++) if (vetor[i] > vetor[i+1]) { aux = vetor[i]; vetor[i] = vetor[i+1]; vetor[i+1] = aux; trocou = 1; } Suas quádruplas com alguma otimização:

A propósito, quádruplas para indexação: Sejam as seguintes declarações e comandos: int i, j, k, A[6][5]; i = 4; j = 3; k = A[i][j-2]; A[10-i][2*j+3] = i + j * k; Acesso a um elemento genérico A[i][j]: Uma vez conhecido o endereço inicial da matriz A, é necessário localizar o elemento A[i][j] Seja a seguir o mapa de A[6][5] na memória:

Seja m o número de linhas e n o número de colunas da matriz A O endereço do elemento A[i][j] é dado pela fórmula: Ender (A) + i * n + j Para m = 6, n = 5, o endereço de A[4][3] é Ender (A) + 23  

No programa, cada índice pode ser uma expressão inteira Calcula-se o valor de cada índice, empilhando-o numa pilha de índices Isso pode ser feito pela execução de uma quádrupla de operador IND: IND, i , ---- , ---- IND, j , ---- , ----  

Calcula-se o endereço de A[i][j], usando uma quádrupla de operador INDEX: INDEX , A , 2 , temp1 Sua execução consiste em: Pegar as dimensões e o endereço de A na tabela de símbolos Desempilhar dois índices Calcular o endereço, colocando-o na variável temp1 A variável temp1 é portanto um ponteiro  

Formação do código intermediário: :=, 3, ..., j IND, i, ..., ... -, j, 2, temp1 IND, temp1, ..., ... INDEX, A, 2, temp2 @, temp2, ..., temp3 +, temp3, 5, k int i, j, k, A[6][5]; i = 4; j = 3; k = A[i][j-2] + 5; A[10-i][2*j+3] = i+j*k; temp2 tem o endereço do elemento A[i][j-2] É necessário saber o valor guardado nesse elemento A quádrupla @, temp2, ..., temp3 atribui a temp3 o valor do local apontado por temp2

Formação do código intermediário: :=, 3, ..., j IND, i, ..., ... -, j, 2, temp1 IND, temp1, ..., ... INDEX, A, 2, temp2 @, temp2, ..., temp3 +, 5, temp3, k -, 10, i, temp4 IND, temp4, ..., ... *, 2, j, temp5 +, temp5, 3, temp6 IND, temp6, ..., ... INDEX, A, 2, temp7 *, j, k, temp8 +, i, temp8, temp9 #, temp9, ..., temp7 int i, j, k, A[6][5]; i = 4; j = 3; k = A[i][j-2] + 5; A[10-i][2*j+3] = i+j*k; temp7 tem o endereço do elemento A[10-i][2*j+3] O valor de temp9 deve ser atribuído ao local apontado por temp7 A quádrupla #, temp9, ..., temp7 atribui o valor de temp9 ao local apontado por temp7

Voltando ao laço do programa anterior: for (i = 0; i<=p; i++) if (vetor[i] > vetor[i+1]) { aux = vetor[i]; vetor[i] = vetor[i+1]; vetor[i+1] = aux; trocou = 1; } Suas quádruplas:

Estrutura de dados São omitidos vários ponteiros As quádruplas poderiam ser guardadas numa lista encadeada ao invés de num vetor

Desvantagens da interpretação: A execução de programas compilados é muito mais rápida que a de programas interpretados Apesar do código intermediário ser aperfeiçoado antes da interpretação propriamente dita, o código objeto ainda pode ser otimizado Isso não ocorre em programas interpretados Um interpretador faz por software a interpretação do código da operação; num programa compilado isso ocorre por hardware, o que é muito mais rápido

Vantagens da interpretação: O código intermediário é independente de máquina, o que lhe confere portabilidade Um programa compilado só pode rodar em máquinas compatíveis com sua máquina alvo Interpretadores se mostram adequados para as redes de computadores heterogêneos, que é o caso da Internet A elaboração de um módulo interpretador propriamente dito é muito mais simples que a de uma retaguarda de compilador

Os detalhes da arquitetura da máquina-alvo complicam muito o projeto da retaguarda Para casos em que a rapidez de execução não é fundamental, os interpretadores são preferidos, em comparação com os compiladores A Linguagem Java: Seu compilador gera código denominado bytecode, independente de máquina Bytecode é traduzido para linguagem de máquina por uma máquina virtual residente em qualquer ambiente Java Bytecode é portável, porém, para ser executado, deve ser traduzido, o que torna o processo mais lento

1.4 – Automação da Construção de Compiladores 1.4.1 – Bootstrapping e compiladores cruzados O compilador para a primeira linguagem de programação só poderia ter sido escrito em Assembly Assim foi com Fortran e Cobol Seus projetos demandaram esforço de programação descomunal

No princípio: Assembler Máquina M1

Fortran Fortran Primeiro compilador Fortran, escrito em Assembly: Assembler Fortran em M1 Máquina M1

Fortran Algol Fortran Algol Compilador Algol, escrito em Fortran: Fortran em Assembly Assembler Algol em Fortran Fortran em M1 Algol em M1 Máquina M1

Fortran Pascal Algol Fortran Algol Pascal Compilador Pascal, escrito em Algol: Fortran em Assembly Pascal em Algol Assembler Algol em Fortran Fortran em M1 Algol em M1 Pascal em M1 Máquina M1

Fortran Pascal C Algol Fortran Algol Pascal C Compilador C, escrito em Pascal: Fortran em Assembly Pascal em Algol C em Pascal Assembler Algol em Fortran Fortran em M1 Algol em M1 Pascal em M1 C em M1 Máquina M1

Fortran Pascal C Algol Fortran Algol Pascal L1 em C L1 em M1 C L2 em C Em UNIX, compiladores L1, L2, ... , escritos em C: Fortran em Assembly Pascal em Algol C em Pascal Assembler Algol em Fortran Fortran em M1 Algol em M1 Pascal em M1 L1 em C L1 em M1 C em M1 L2 em C L2 em M1  Máquina M1 

Fortran Pascal C Algol Fortran Algol Pascal C1 em C C1 em M1 C C2 em C Em UNIX, compiladores C eram escritos em C: Fortran em Assembly Pascal em Algol C em Pascal Assembler Algol em Fortran Fortran em M1 Algol em M1 Pascal em M1 C1 em C C1 em M1 C em M1 C2 em C C2 em M1  Máquina M1 

Bootstrapping: propriedade de uma linguagem compilar a si mesma Compilador cruzado: compilador que roda numa máquina e gera código para outra Para uma máquina M2, seria necessário escrever um programa em Assembly para um primeiro compilador? Com bootstrapping e compiladores cruzados pode-se evitar isso (visto a seguir)

Um compilador é caracterizado por 3 linguagens: A linguagem-fonte (F) que ele compila A linguagem-objeto (O) para a qual ele gera código A linguagem de implementação (I) na qual ele está escrito Simbolicamente, FIO Ou, usando diagrama T: F O I

Seja M usado para denotar a linguagem de máquina de um computador ou máquina M Para um compilador rodar na máquina M, sua linguagem de implementação deve ser M F O M

Seja um compilador L1MM residindo na máquina M Deseja-se em M um compilador para uma nova linguagem L2, ou seja, L2MM Primeiramente escreve-se um programa L2L1M Depois roda-se na máquina M: L2 M L1 Entrada L2 M M Saída L1 M M Programa em execução O compilador de L2 está pronto para rodar em M

Esquema para se obter um compilador cruzado: Agora em M1, um compilador de L2 para a máquina M2 Os programas escritos em L2 são compilados em M1 e o código objeto é transportado para M2 Entrada L2 M2 L1 L2 M2 M1 Saída L1 M1 M1 Compilador residindo em M1, em execução

Primeiramente, bootstrapping: LLM2 Seja então L a primeira linguagem a ser instalada na máquina M2, mas já instalada na máquina M1 (LM1M1) Primeiramente, bootstrapping: LLM2 Depois, produz-se em M1 um compilador cruzado Finalmente, usando em M1 o compilador cruzado produzido É só transportar LM2M2 para a máquina M2 L M2 L L M2 M2 Saída Entrada Entrada L M2 M1 Saída Programa em execução L M1 M1 Programa em execução Compilador desejado

1.4.2 – Compiladores de compiladores As ferramentas de automação, logo que começaram a surgir, receberam alguns nomes um tanto ambiciosos: Geradores de compiladores Compiladores de compiladores Sistemas de construção de tradutores

1.4.2 – Compiladores de compiladores Eram ferramentas de uso limitado, pois eram orientadas em torno de modelos particulares de linguagens Devido à grande heterogeneidade das linguagens e das arquiteturas, é muito difícil a elaboração de um gerador de propósitos gerais eficiente O que existe hoje são ferramentas automáticas para o projeto de componentes específicos, relacionados a seguir

1.4.3 – Ferramentas para cada componente Utilizam linguagens especializadas para a especificação e implementação do componente e algoritmos bem sofisticados Geradores de analisadores léxicos: Têm como entrada expressões regulares e implementam um autômato finito reconhecedor e classificador dos átomos dos programas a serem compilados A mais conhecida entre elas é o Lex do sistema Unix, que possui também versões para o sistema DOS O programa gerado é escrito em Linguagem C

1.4.3 – Ferramentas para cada componente Geradores de analisadores sintáticos: Têm como entrada a gramática livre de contexto da linguagem-fonte do compilador Nos compiladores primitivos, a análise sintática consumia grande fração do tempo de compilação e do esforço intelectual para escrever um compilador Hoje é considerada uma das fases mais fáceis de serem implementadas

1.4.3 – Ferramentas para cada componente Geradores de analisadores sintáticos: Utilizam algoritmos de analise muito eficientes, porém muito complexos para serem implementados à mão A mais conhecida: Yacc (Yet Another Compiler-Compiler) do sistema UNIX que também possui diversas versões para o sistema DOS O programa gerado também é escrito em Linguagem C

1.4.3 – Ferramentas para cada componente Geradores de código intermediário: Produzem uma coleção de rotinas que, ao caminhar pela árvore sintática do programa, já com atributos calculados pelo analisador semântico, produzem o código intermediário Analisadores de fluxo de dados: Importante ferramenta para a otimização do código intermediário

1.4.3 – Ferramentas para cada componente Geradores de código objeto: Recebem como entrada uma coleção de regras que definem a tradução de cada tipo de comando do código intermediário em código de máquina ou Assembly Essas regras devem incluir detalhes suficientes para se escolher os locais adequados para alocação de variáveis (registradores, memória, pilha, etc)