A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Registos em Ficheiros - Estruturas Pedro Barahona DI/FCT/UNL Introdução aos Computadores e à Programação 2º Semestre 2007/2008 14 Maio 20081Registos em.

Apresentações semelhantes


Apresentação em tema: "Registos em Ficheiros - Estruturas Pedro Barahona DI/FCT/UNL Introdução aos Computadores e à Programação 2º Semestre 2007/2008 14 Maio 20081Registos em."— Transcrição da apresentação:

1 Registos em Ficheiros - Estruturas Pedro Barahona DI/FCT/UNL Introdução aos Computadores e à Programação 2º Semestre 2007/2008 14 Maio 20081Registos em Ficheiros - Estruturas

2 14 Maio 2008 Registos em Ficheiros - Estruturas 2 Registos em Ficheiros Muita informação alfanumérica está registada em ficheiros, na forma de registos. Por exemplo, numa base de dados da empresa, são mantidos ficheiros com informação sobre os empregados da empresa. Muitas aplicações (de gestão) consistem em ler ficheiros e criar outros com a informação devidamente processada. Por exemplo: ler um ficheiro de empregados e escrever outro, apenas com os empregados com vencimento superior a 1000.

3 14 Maio 2008 Registos em Ficheiros - Estruturas 3 Registos em Ficheiros A primeira questão a resolver consiste no tratamento dos espaços em sequências de caracteres. Isto porque há duas formas típicas de armazenamento dessas sequências: –Comprimento Fixo: As sequências têm sempre o mesmo número de caracteres (sendo usados espaços se necessário); –Comprimento Variável: As sequências têm o número de caracteres necessários, sendo necessários caracteres separadores, tipicamente tabs (horizontais).

4 14 Maio 2008 Registos em Ficheiros - Estruturas 4 Registos em Ficheiros Por exemplo, o nome Pedro Vieira, no ficheiro abaixo, pode ser codificado –Comprimento Fixo: Com 5+1+6 = 12 caracteres (incluindo o espaço), mais 13 espaços, para permitir sequências de comprimento 25, que podem armazenar nomes com até 25 caracteres (incluindo espaços); –Comprimento Variável: Apenas com os 12 caracteres necessários, sendo separado do vencimento por um tab horizontal (\t).

5 14 Maio 2008 Registos em Ficheiros - Estruturas 5 Registos em Ficheiros Em Octave (e em C) os dois tipos de codificação requerem instruções de leitura padronizada (com templates) diferentes. –Comprimento Fixo: Utiliza-se um template %nc em que n é o número de caracteres a ler; –Comprimento Variável: Utiliza-se um template %s; Neste último caso, levanta-se um problema: O template %s, não lê espaços nem caracteres brancos. Assim, o nome Pedro Vieira seria lido não como 1, mas sim como 2 sequências. Em geral, ter-se-ia de conhecer o número de nomes (próprios, apelidos e partículas de ligação). Isto pode ser evitado com o uso de espaços especiais (non break spaces - ASCII 160), que são considerados como quaisquer outros caracteres, mas impressos como espaços.

6 14 Maio 2008 Registos em Ficheiros - Estruturas 6 Leitura de Ficheiros Caso seja necessário, pode converter-se um ficheiro noutro, convertendo-se todos os espaços em espaços especiais, com a função abaixo: function x = rem_sp(f_in_name, f_out_name); [f_in, msg] = fopen(f_in_name, "r"); [f_aux,msg] = fopen(f_out_name, "w"); [ch, count] = fscanf(f_in,"%1c","C"); while !feof(f_in) if ch == " " ch = setstr(160); endif; fprintf(f_aux, "%1c", ch); [ch, count] = fscanf(f_in,"%1c","C"); endwhile; fclose(f_in); fclose(f_aux); endfunction;

7 14 Maio 2008 Registos em Ficheiros - Estruturas 7 Comprimento Fixo: –Cada linha do ficheiro, assumindo-se que um nome é guardado com 25 caracteres, pode ser lida com as seguintes instruções de leitura padronizada, fscanf ou numa só instrução Leitura de Ficheiros 610Paulo Fernandes Lopes2341.3615/04/1996 [cod, count] = fscanf(fid,"%i","C"); [nome, count] = fscanf(fid,"%25c","C"); [venc, count] = fscanf(fid,"%f","C"); [data,count] = fscanf(fid,"%s","C"); [cod,nome,venc,data,count]=fscanf(fid,"%i%25c%f%s","C");

8 14 Maio 2008 Registos em Ficheiros - Estruturas 8 Comprimento Variável: –Neste caso, quer o nome quer a data podem ser lidos com o template %s da instrução fscanf, podendo o registo de um empregado ser lido quer na forma : quer numa só instrução Leitura de Ficheiros 610Paulo Fernandes Lopes2341.3615/04/1996 [cod, count] = fscanf(fid,"%i","C"); [nome, count] = fscanf(fid,"%s","C"); [venc, count] = fscanf(fid,"%f","C"); [data,count] = fscanf(fid,"%s","C"); [cod,nome,venc,data,count] = fscanf(fid,"%i%s%f%s","C");

9 14 Maio 2008 Registos em Ficheiros - Estruturas 9 Comprimento variável: –Neste caso o registo de um empregado pode ser escrito como ou numa só instrução, como anteriormente. Notar agora que 1.Após cada campo, deve ser escrito o tab (\t) de separação, excepto no último campo, após o que se escreve o caracter (\n) 2.Alguns templates podem ser fixos, (por exemplo, "%7.2f\t) para evitar as convenções por omissão do Octave. Escrita de Ficheiros fprintf(fid, "%i\t", cod); fprintf(fid, "%s\t", nome); fprintf(fid, "%7.2f\t", venc); fprintf(fid, "%s\n", data); 610Paulo Fernandes Lopes2341.3615/04/1996

10 14 Maio 2008 Registos em Ficheiros - Estruturas 10 Comprimento fixo: –A escrita de ficheiros depende igualmente do formato utilizado para as strings. Em comprimento fixo, o registo pode ser escrito como ou numa só instrução, como anteriormente. Notar ainda que 1.O sinal – (em %-25s) justifica, à esquerda, o campo nome. 2.Após o último campo deve ser escrito um caracter (\n), para mudança de linha Escrita de Ficheiros fprintf(fid, "%3i", cod); fprintf(fid, "%-25s", nome); fprintf(fid, "%7.2f", venc); fprintf(fid, "%10s", data); fprintf(fid, "%c", \n); 610Paulo Fernandes Lopes 2341.3615/04/1996

11 14 Maio 2008 Registos em Ficheiros - Estruturas 11 Podemos agora abordar o problema inicialmente colocado: 1.Ler um ficheiro de empregados; e 2.Escrever outro, apenas com os empregados com vencimento superior a 1000 euros. Naturalmente o programa dependerá de os ficheiros serem lidos e escritos em formato fixo ou variável. Assumiremos que esta diferença apenas se reflectirá no campo nome, já que o campo data não contem espaços e pode ser lido em formato cadeia (%s) sem problema. Selecção de Registos

12 14 Maio 2008 Registos em Ficheiros - Estruturas 12 Eis a versão para formato fixo : Selecção de Registos [f_in, msg_in ] = fopen("empresa_in_fix.txt", "r"); [f_out, msg_out] = fopen("empresa_out_fix.txt", "w"); [cod,nome,venc,data,ct] = fscanf(f_in,"%i%25c%f%s","C"); while !feof(f_in) if venc > 1000 fprintf(f_out,"%3i%-25s%7.2f%12s\n", cod,nome,venc,data); printf( "%3i%-25s%7.2f%12s\n", cod,nome,venc,data); endif; [cod,nome,venc,data,ct] = fscanf(f_in,"%i%25c%f%s","C"); endwhile; fclose(f_in); fclose(f_out);

13 14 Maio 2008 Registos em Ficheiros - Estruturas 13 E a versão para formato variável : Selecção de Registos rem_sp("empresa_in_var.txt", "empresa_aux_var.txt"); [f_aux, msg] = fopen("empresa_aux_var.txt", "r"); [f_out, msg] = fopen("empresa_out_var.txt", "w"); [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); while !feof(f_aux) if venc > 1000 fprintf(f_out, "%i\t%s\t%7.2f\t%s\n", cod,nome,venc,data); printf( "%i\t%s\t%7.2f\t%s\n", cod,nome,venc,data); endif; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); endwhile; fclose(f_aux); fclose(f_out);

14 14 Maio 2008 Registos em Ficheiros - Estruturas 14 Podemos agora considerar outro tipo de processamento de informação, que não envolve necessariamente a escrita de novos ficheiros, correspondente a: –Cálculo de totais e médias (de vencimentos, por exemplo) –Determinação de máximos e mínimos (de vencimentos, ou antiguidades) Vamos ilustrar estes problemas com programas para determinação dos vencimentos totais e médios dos empregados da empresa, bem como da determinação do empregado mais antigo. Para ambos os problemas, apenas são apresentadas as versões para formato variável. De notar ainda a instrução printf, que permite escrever no terminal mensagens formatadas (com os formatos usados em ficheiros). Processamento de Registos

15 14 Maio 2008 Registos em Ficheiros - Estruturas 15 O tratamento de vencimentos utiliza um contador (variável i) de registos lidos e uma variável (total) para determinação do total dos vencimentos (sendo a média igual à razão entre total e i). Processamento de Registos rem_sp("empresa_in_var.txt", "empresa_aux_var.txt"); [f_aux, msg] = fopen("empresa_aux_var.txt", "r"); i = 0; total = 0; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); while !feof(f_aux) i = i+1; total = total+venc; [cod,nome,venc,data,count] = fscanf(f_aux,"%i%s%f%s","C"); endwhile; printf("o total dos vencimentos é de %7.2f \n", total); printf("a média dos vencimentos é de %7.2f \n",total/i); fclose(f_aux); fclose(f_out);

16 14 Maio 2008 Registos em Ficheiros - Estruturas 16 O tratamento de datas, implica reconhecer quando uma data é anterior a outra, o que é feito com a função data_comp que compara duas datas, sendo armazenada a data menor Processamento de Registos rem_sp("empresa_in_var.txt", "empresa_aux_var.txt"); [f_aux, msg] = fopen("empresa_aux_var.txt", "r"); data_menor =01/01/2100; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); while !feof(f_aux) if data_comp(data,data_menor) = -1 data_menor = data; endif; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); endwhile; printf("a entrada mais antiga foi em %s\n",data_menor); fclose(f_aux);

17 14 Maio 2008 Registos em Ficheiros - Estruturas 17 A comparação de datas é feita através da comparação dos anos, meses e dias, das duas datas Naturalmente, há que ter o cuidado de converter inicialmente as cadeias de caracteres em números (com a função str2num). Comparação de Datas function d = data_comp(data1,data2); % data no formato dd/mm/aaaa ano1 = str2num(substr(data1,7,4)); ano2 = str2num(substr(data2,7,4)); mes1 = str2num(substr(data1,4,2)); mes2 = str2num(substr(data2,4,2)); dia1 = str2num(substr(data1,1,2)); dia2 = str2num(substr(data2,1,2)); d = d_comp(ano1, mes1, dia1, ano2, mes2, dia2); endfunction

18 14 Maio 2008 Registos em Ficheiros - Estruturas 18 Uma vez obtidos os anos, dias e meses as datas podem ser comparadas, comparando-se sucessivamente os anos, e se necessário os meses e dias). Comparação de Datas function d = d_comp(ano1, mes1, dia1, ano2, mes2, dia2); if ano1 < ano2 d = -1; elseif ano1 > ano2 d = 1; elseif mes1 < mes2 d = -1; elseif mes1 > mes2 d = 1; elseif dia1 < dia2 d = -1; elseif dia1 > dia2 d = 1; else d = 0; endif endfunction

19 14 Maio 2008 Registos em Ficheiros - Estruturas 19 No caso do empregado mais antigo, é interessante informar não só quando ele entrou ao serviço (isto é, a data), mas também que é ele (isto é, o seu nome). Este problema pode ser resolvido com uma pequena adaptação do código, guardando não só a data mais antiga como o nome Processamento de Registos rem_sp("empresa_in_var.txt", "empresa_aux_var.txt"); [f_aux, msg] = fopen("empresa_aux_var.txt", "r"); data_menor =01/01/2100; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); while !feof(f_aux) if data_comp(data,data_menor) == -1 data_menor = data; antigo = nome; endif; [cod,nome, venc, data, count] = fscanf(f_aux,"%i%s%f%s","C"); endwhile; printf("o empregado mais antigo é %s \n", antigo); printf("com data de entrada %s \n", data_menor); fclose(f_aux);

20 14 Maio 2008 Registos em Ficheiros - Estruturas 20 Todos estes programas obrigam, cada vez que se pretende responder a uma questão : 1.A ler registos de um ficheiro; 2.A processar cada um dios registos, isoladamente; e, eventualmente 3.A escrever os registos num outro ficheiro No entanto, a leitura e escrita de ficheiros, mesmo em discos rápidos é tipicamente milhares de vezes mais lenta que a leitura a partir de dados em memória. Haverá pois vantagem em copiar um ficheiro de registos para memória e passar a responder às questões a partir de aí. Veremos como responder a esta questão em geral e, no caso do Octave, como tal poderá ser feitos com estruturas e listas. Estruturas e Listas

21 14 Maio 2008 Registos em Ficheiros - Estruturas 21 Embora Vectores e Matrizes sejam muito úteis quando os dados são todos do mesmo tipo (no Octave, de qualquer tipo numérico), em muitos casos, a informação que se pretende agrupar com um só identificador não é do mesmo tipo, como é o caso dos registos considerados anteriormente. Por exemplo, um empregado duma empresa pode ser associado à seguinte informação –Um código (um número?) –Um nome (uma cadeia de caracteres) –Um vencimento (um decimal) –Uma data de entrada (uma cadeia, ou 3 campos numéricos, para o dia, mês e ano) Estruturas

22 14 Maio 2008 Registos em Ficheiros - Estruturas 22 As várias linguagens de programação permitem o agrupamento destes dados heterogéneos, com um mesmo identificador de uma forma variada (records no Pascal, Struct em C,...) O Octave adopta uma designação semelhante à do C, denominando estes agrupamentos como estruturas. Consideremos pois o caso do empregado abaixo, em que gostaríamos de agregar toda a informação numa única variável, do tipo estrutura, que denotaremos como emp_610. Estruturas

23 14 Maio 2008 Registos em Ficheiros - Estruturas 23 Uma vez definidos os nomes dos campos da estrutura, podemos atribuir-lhe os valores pretendidos. O acesso a um campo da estrutura é feito fazendo suceder ao nome da estrutura o nome do campo pretendido, separado por um ponto (.). Por exemplo, a atribuição dos 4 valores dos campos pode ser feita pelas seguintes atribuições: Estruturas emp_610.cod = 610; emp_610.nome = Paulo Fernandes Lopes; emp_610.venc = 2341.36; emp_610.data=15/04/1996; emp_610 =

24 14 Maio 2008 Registos em Ficheiros - Estruturas 24 Uma vez agrupados os vários items de informação numa só variável do tipo estrutura, podemos referir alguns campos depois de verificar outros. Por exemplo, dados vários empregados com o tipo referido, indicar qual o nome dos que ganham mais de 1000 euros. Na sintaxe do Octave, tal poderia ser feito através da instrução condicional No entanto este tipo de processamento só é verdadeiramente útil se tivermos a possibilidade de aceder a todos os empregados de uma forma genérica. Estruturas if emp_610.venc > 1000 then disp(emp_610.nome) endif

25 14 Maio 2008 Registos em Ficheiros - Estruturas 25 Por exemplo, se tivessemos uma tabela com várias linhas, com códigos na primeira coluna e vencimentos na 2ª coluna, poderíamos apresentar os códigos dos empregados com vencimento superior a 1000 euros através da seguinte instrução iterativa: Por analogia, o que é necessário é poder aceder a uma sequência de (1 a n) estruturas do tipo da do empregado. Na maioria das linguagens de programação, essa analogia é imediata, já que se podem especificar vectores de estruturas. Tal é o caso do Octave, mas apenas a partir da versão 3.X (as anteriores usavam o conceito de lista, entretanto descontinuado). Tabelas for i = 1:n if tabela(i,2) > 1000 disp(tabela(i,1)) endif endfor; 12 1 6102341.36 2 825989.24 3 3161389.17 4 345310.32 5 723767.26...

26 14 Maio 2008 Registos em Ficheiros - Estruturas 26 Nestas linguagens, podemos representar o conjunto de empregados através de um vector, emps, em que cada elemento é uma estrutura (de empregado) com os campos definidos como anteriormente. Agora, para obter os códigos dos empregados com vencimento superior a 1000 euros bastará usar uma seguinte instrução iterativa, análoga à anterior Vectores de Estruturas for i = 1:n if emps(i).vencimento > 1000 disp(emps(i)) endif endfor; for i = 1:n if tabela(i,2) > 1000 disp(tabela(i,1)) endif endfor;

27 14 Maio 2008 Registos em Ficheiros - Estruturas 27 Em Octave, não existe a possibilidade de definir vectores de estruturas, já que os vectores são numéricos. O Octave no entanto, disponibiliza uma estrutura de dados, a lista, que permite organizar um conjunto de elementos em memória, podendo esses elementos ter um tipo qualquer, numérico ou não. Em Octave, o conjunto de empregados pode ser representado por uma lista, que também designaremos por emps, e que permite o acesso a um seu elemento de uma forma parecida, nomeadamente Listas (Octave 2.X e anteriores) for i = 1:n if nth(emps,i).vencimento > 1000 disp(nth(emps,i)) endif endfor;

28 14 Maio 2008 Registos em Ficheiros - Estruturas 28 Listas - Criação (Octave 2.X e anteriores) Uma lista é uma sequência de dados do mesmo tipo, simples ou complexo, para as quais estão definidas (em Octave) as operações básicas ed criação, adição, acesso e alteração. Criação: list(elem_1, elem_2,..., elem_k) Cria uma lista, com os elementos de 1 a k. Nota 1: A lista pode ser vazia ! Nota 2: Geralmente, pretende-se que todos os elementos tenham o mesmo tipo. No entanto, uma lista pode conter elementos de qualquer tipo, ou mesmo ser heterogénea, como indicado >> emps = list() emps = () emp.cod = 25, emp.venc = 1025.7; emps = list(1, estranho, emp)

29 14 Maio 2008 Registos em Ficheiros - Estruturas 29 Listas – Adição e Acesso (Octave 2.X e anteriores) A uma lista podem ser adicionados, no seu final, mais elementos, com a instrução Adição: append(nome_lista, elem_1, elem_2,..., elem_k) Exemplo: A lista nums é inicialmente criada com os números 1, 2 e 3, sendo posteriormente acrescentados os números 4 e 5. O acesso ao k-ésimo elemento de uma lista pode ser feito através da instrução Acesso: nth(nome_lista, k) Exemplo: Obter a diferença entre o 3º e o 5º elemento da lista nums, criada anteriormente. dif = nth(nums,3) – nth(nums,5) nums = list(1,2,3); nums = append(nums, 4, 5)

30 14 Maio 2008 Registos em Ficheiros - Estruturas 30 Listas – Alteração (Octave 2.X e anteriores) A alteração de elementos de uma lista pode ser feita por alteração directa dos seus elementos identificados pelos seus índices. Exemplo 1: Substituir na lista nums, com os números de 0 a 6, os seu 6º elemento (inicialmente com o valor 5) pelo valor 7. Neste caso, a lista nums que se obtem, contem os números (0,1,2,3,4,7,6). Exemplo 2: Substituir na lista nums, anterior, os seus primeiros 2 elementos pelos números 9 e 8. passando, a lista nums, a conter os números (9,8,2,3,4,7,6). nums(6) = 7 nums(1:2) = list(9,8)

31 14 Maio 2008 Registos em Ficheiros - Estruturas 31 Listas – Substituição (Octave 2.X e anteriores) Em alguns casos, nomeadamente em operações de ordenação, interessa trocar a posição de dois elementos de uma lista. Esta operação pode ser implementada por uma função, troca, que inclui operações de acesso e alteração de uma lista. Mais especificamente, Função troca: A troca dos i-ésimo e j-ésimo elementos de uma lista pode ser feita com a função abaixo.. function lista = troca(lista, i, j); x = nth(lista,i); % guarda o elemento 1 lista(i) = nth(lista,j); % substitui i por j lista(j) = x;% repõe o elemento j em i endfunction


Carregar ppt "Registos em Ficheiros - Estruturas Pedro Barahona DI/FCT/UNL Introdução aos Computadores e à Programação 2º Semestre 2007/2008 14 Maio 20081Registos em."

Apresentações semelhantes


Anúncios Google