A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

TC – DEI, 2005/2006. Representação de Informação -- Texto -- Paulo Marques Tecnologia dos Computadores.

Apresentações semelhantes


Apresentação em tema: "TC – DEI, 2005/2006. Representação de Informação -- Texto -- Paulo Marques Tecnologia dos Computadores."— Transcrição da apresentação:

1 TC – DEI, 2005/2006

2 Representação de Informação -- Texto -- Paulo Marques Tecnologia dos Computadores 2005/2006

3 TC – DEI, 2005/2006 Representação de Informação Até agora vimos... Como é que se representam números inteiros Como é que se representam fracções Vamos ver... Como é que se representa texto Como é que se representam imagens Como é que se representa som Técnicas simples de correcção de erros Dispositivos de armazenamento de informação

4 TC – DEI, 2005/2006 Representação de Caracteres ASCII = American Standard Code for Information Interchange Tradicionalmente, utilizava-se 7 bits para representar os diversos caracteres 7 bits 128 combinações diferentes possíveis Exemplo: A = ( ) 2 = (65) 10 Mais tarde, os 7 bits foram extendidos a 8, permitindo representar 256 caracteres diferentes

5 TC – DEI, 2005/2006 Tabela de ASCII (7 bits)

6 TC – DEI, 2005/2006 Texto A representação de texto é simplesmente uma sequência de caracteres OLA Código ASCII

7 TC – DEI, 2005/2006 UNICODE Na prática, 256 caracteres diferentes não chegam para todas as línguas Formou-se um consórcio internacional para definir um standard que para codificação de caracteres aplicável a todas as línguas UNICODE (http://www.unicode.org)http://www.unicode.org Cada caracter é representada por 16 bits 16 bits 2 16 combinações diferentes (65536!) Na verdade, o que são representados não são exactamente os caracteres... Os primeiros 256 caracteres têm o mesmo valor do que em ASCII

8 TC – DEI, 2005/2006 UNICODE – Um Exemplo

9 TC – DEI, 2005/2006 Compressão de Texto Apesar do espaço de armazenamento estar continuamente a aumentar, é desejável por vezes comprimir os dados Transmissão pela rede Armazenamento de longa duração Em geral... Maior eficiência e aproveitamento de recursos Três métodos comuns de comprimir texto Keyword encoding Run-length encoding Huffman codes

10 TC – DEI, 2005/2006 Keyword Encoding Substituir palavras muito comuns por caracteres especiais ou sequências especiais de caracteres As palavras são substituídas de acordo com uma tabela de frequência de ocorrência ChaveSignificado %carro $acidente &senhor #do

11 TC – DEI, 2005/2006 Aplicando a codificação... No acidente estiveram envolvidos três carros. O carro do senhor António ficou destruído. O carro do senhor José não sofreu grandes danos no acidente. O carro do senhor Carlos... bom, depois do acidente, nem se pode chamar aquilo um carro bytes No $ estiveram envolvidos três carros. O % # & António ficou destruído. O % # & José não sofreu grandes danos no $. O % # & Carlos... bom, depois # $, nem se pode chamar aquilo um % bytes (76%)

12 TC – DEI, 2005/2006 Run-length Encoding (RLE) Tipicamente utilizando quando o mesmo padrão/letra surge muitas seguido numa sequência de dados Não é comum em texto, mas em muitos outros tipos de dados (imagem, vídeo) Este tipo de algoritmo é a origem dos métodos de compressão utilizados em muitos utilitários comuns Neste tipo de compressão, uma sequência de caracteres que se repetem é substituída por um marcador especial, pelo caracter em questão, seguido do número de vezes que ele aparece.

13 TC – DEI, 2005/2006 RLE – Exemplos AAAAAAAAAA *A10 AABBBBBBBBAMMKKKKKKKKKM AA*B8AMM*K9M Nestes dois exemplos o texto é ASCII, no entanto pode-se fazer em binário, o princípio é o mesmo De facto, ASCII é binário!

14 TC – DEI, 2005/2006 Huffman Codes A letra mais frequente no alfabeto português é o e Ao comprimir um texto, porque é que o e tem de ocupar o mesmo número de bits que... o x, por exemplo? Os códigos de Huffman representam os diferentes caracteres utilizando um número diferentes de bits Os caracteres mais comuns utilizam menos bits!

15 TC – DEI, 2005/2006 Huffman Codes - Exemplo ChaveSignificado 00 ESPAÇO 01 A 100 O 110 U 111 V 1010 S 1011 C VOU A CASA

16 TC – DEI, 2005/2006 Huffman Codes - Exemplo Analisemos o exemplo... VOU A CASA 10 bytes de ASCII < 4 bytes Compressão de 60%! Existem técnicas especiais que permitem construir as tabelas de codificação a utilizar Nós não as estudaremos aqui... Uma característica fundamental é que nenhuma dos códigos utilizados é prefixo de nenhum outro código!

17 Representação de Informação -- Imagens --

18 TC – DEI, 2005/2006 Percepção da cor O nosso olho tem dois tipos de sensores: CONES e BASTONETES Os CONES percepcionam a cor, sendo sensíveis a três frequências: vermelho, verde e azul

19 TC – DEI, 2005/2006 Percepção da cor A percepção da cor é possível porque as várias cores podem ser vistas como uma mistura de outras cores, nomeadamente: VERDE, VERMELHO e AZUL Existem outros sistemas de coloração... RGB = Red Green Blue CYMK = Cyan Yellow Magenta Black HSL = Hue Saturation Luminosity RGBCYMK

20 TC – DEI, 2005/2006 Representação da cor Tipicamente os sistemas informáticos utilizam o sistema RGB Red, Green, Blue A cada cor é atribuído um número 8 bits por cor cada cor de 0 a 255 Total = 24 bits de cor (TRUE COLOR) Exemplos: (255,0,0) (0,255,0) (0,0,255) (255,255,255) (0,0,0) (255,255,0) (0,255,255) (255,0,255) (150,150,150)

21 TC – DEI, 2005/2006 Imagens As imagens são formadas por um conjunto muito grande de pontos pixels A cada pixel corresponde uma cor i.e. três números RGB

22 TC – DEI, 2005/2006 Armazenamento de imagens Existem imensos formatos de armazenamento de imagens GIF, JPEG, BMP, PNG, TIFF,... Na maior parte dos casos as imagens são comprimidas antes de serem armazenadas x1200x24bits cor = 5.5Mbytes! Dois tipos de compressão Com perda de qualidade (e.g JPEG) Sem perca de qualidade (e.g. Compressed-TIFF)

23 TC – DEI, 2005/2006 Desenhos/Imagens Vectoriais Em vez de se armazenar os pixels, guarda-se uma descrição do gráfico/imagem Muitos programas de desenho/edição electrónica utilizam este método (e.g. CorelDraw, fontes TTF, AutoCAD) Os desenhos podem ser escalados de forma transparente = poly[(0,0) -> (50,30) -> (40,80) -> (0,0)]

24 TC – DEI, 2005/2006 Video Em video, o princípio é o mesmo Guarda-se um conjunto de imagens sucessivas (e.g. 25 imagens por segundo) Devido ao imenso espaço que ocupam, tem de se compactar as imagens de uma forma eficiente CODEC = COmpressor/DECompressor E.g. DivX! Dois métodos de compressão... Compressão temporal Não considerar as diferenças entre duas imagens sucessivas Compressão espacial Eliminar a redundância dentro de uma imagem

25 TC – DEI, 2005/2006 Som Os sons que ouvimos correspondem às vibrações que o ar transmite ao tímpano

26 TC – DEI, 2005/2006 Som - Digitalização Nos computadores o som é digitalizado fazendo-o corresponder a números discretos. Quando se digitaliza som existe uma certa taxa de amostragem

27 TC – DEI, 2005/2006 Armazenamento de Som Duas formas de armazenamento Sem perdas, tipicamente não comprimida (e.g. wav) Com perdas, comprimida (e.g. mp3) Nas formas comprimidas é tido em conta a forma como nós, humanos, ouvimos o som! O formato mp3 é codificado de acordo com o que nós conseguimos ouvir em cada momento. As partes que não conseguimos ouvir são eliminadas. Em mp3 a compressão é feita por códigos de Huffman

28 TC – DEI, 2005/2006 Resposta do Ouvido Humano...

29 TC – DEI, 2005/

30 Técnicas Básicas de Correcção de Erros

31 TC – DEI, 2005/2006 Correcção de Erros Quando se armazena ou transmite informação, podem existir erros E.g É necessário garantir que, com uma elevada probabilidade, os erros conseguem ser detectados e se possível corrigidos

32 TC – DEI, 2005/2006 Bits de Paridade Dada uma sequência de bits, adiciona-se um bit extra que torna o número de bits resultante de uma certa paridade Paridade PAR: O conjunto resultante tem de ter um número par de bits Paridade ÍMPAR: O conjunto resultante tem de ter um número ímpar de bits Número original 1 Bit de paridade PARIDADE PAR PARIDADE ÍMPAR

33 TC – DEI, 2005/2006 Checksums É uma forma evoluída dos bits de paridade Dado um conjunto de dados junta-se um número que é obtido fazendo uma certa operação sobre esses dados Um exemplo simples: somar e calcular o resto da divisão pelo número máximo que se quer representar Outro exemplo simples:... A prova dos nove! = MOD 100 = 38 38

34 TC – DEI, 2005/2006 Checksums Alguns tipos de checksums muito conhecidos CRC = Cyclic Redundancy Check MD5 = Message Digest 5 Nota O algarismo que está junto ao número do bilhete de identidade é um checksum!

35 TC – DEI, 2005/2006 Códigos de Correcção de Erros Existem códigos que permitem não só detectar erros, como corrigi-los! Distância de Hamming Número de bits diferentes entre duas cadeias Distância de Hamming de 3

36 TC – DEI, 2005/2006 Um código de correcção simples... Se houver um bit errado, consigo detectá-lo e corrigi-lo Se houver dois bits errados, consigo detectar que houve um erro, mas ao corrigir, o resultado é incorrecto Se houver três bits errados, não consigo detectá-lo nem corrigi-lo Neste código, a distância de Hamming é sempre, pelo menos, 3

37 TC – DEI, 2005/2006 Exemplos (envia D – ) Recebe Há apenas um erro, é detectado e corrigido correctamente. O que está mais próximo é o D (distância 1) Detectado, mas ao corrigir, é corrigido para o valor errado (corrige para A!) Três bits errados! Não detectado, nem corrigido, assume- se que é o A! O código de Hamming é pensado para situações de erros não burst. Exemplos de utilização: memórias dos computadores (memória ECC), modems, satélites planetários!

38 Armazenamento de Informação

39 TC – DEI, 2005/2006 Disco Rígido

40 TC – DEI, 2005/2006 CD-ROM

41 TC – DEI, 2005/2006 Tape

42 TC – DEI, 2005/2006 Flash Memory Pen Non-volatile Flash Memory

43 TC – DEI, 2005/2006 Para Saber Mais... Computer Science, An Overview Capítulo 1 (1.3, 1.4, 1.8, 1.9) Computer Science Iluminated Capítulo 3 (3.1, 3.3, 3.4, 3.5, 3.6) Embora este não seja o livro principal, tem a matéria um pouco melhor explicada

44 TC – DEI, 2005/2006


Carregar ppt "TC – DEI, 2005/2006. Representação de Informação -- Texto -- Paulo Marques Tecnologia dos Computadores."

Apresentações semelhantes


Anúncios Google