Fundamentos da Representação de Informações em Computadores Prof. Carlos H. Marcondes marcon@vm.uff.br
Representação e magia Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França)
Caracter instrumental da representação Manipula-se a representação por que é mais econômico que manipular a realidade diretamente O resultado da manipulação da representação é subsídio para a praxis sobre a realidade Similaridade: Representação e Realidade Manipulação = Simulação computador é a máquina capaz de simular a realidade
Representação de conceitos Carro
Representação de conceitos no computador Representação computacional Realidade Carro Representação simbólica (codificação, linguagem) Objeto, conceito Representação por imagens
Representação de informações no computador Representação por IMAGENS – formatos “mapa-de-bits” (bitmap): .BMP, .PCX, .GIF, .TIFF, .JPEG Representação simbólica – uso da linguagem, caracteres são CODIFICADOS – códigos ASCII e EBCDIC Cada caracter é representado por um código de 8 bits
Possibilidades de codificação de informações em função do conjunto de sinais - 1 bit : 0 - 21=2 1 - 2 bits: 00 - 22=4 10 01 11 00 - 3 bits: 000 - 23=8 100 010 001 110 101 011 111 000
Caracteres codificados permitem a busca por um padrão de bits ligados e desligados A palavra “BRASIL” 01000010-01010010-01000001-01010011-01001001-01001100 B R A S I L
FORMATOS para representação de informações Um FORMATO é um específico arranjo de informações, formando um arquivo digital Um FORMATO contém informações voltadas para pessoas (conteúdo) e informações voltadas para os programas que processam estes conteúdos Ex: formato WINWORD (.DOC) Conteúdo – - o caráter “A” Informações para o programa - tipo de fonte - cor - normal, negrito ou itálico - etc, etc, etc Formatos proprietários – exclusivos de um fabricante. Ex: .DOC, PDF Formatos abertos - padronizados. Ex. HTML, XML, JPEG, GIF X
Tabela ASCII
João da Silva, Petrobras e joao@petrobras.com.br são os Conteúdos, #NJoão da Silva #EPetrobras #Mjoao@petrobras.com.br ## #NMaria da Conceição #EBanco do Brasil #Mmaria@bb.com.br João da Silva, Petrobras e joao@petrobras.com.br são os Conteúdos, #N, #E, #M e ## são o Informações de codificação dos elementos do Vocabulário , de modo que minha mala direta possa ser comprendida por um programa
Arquivos em formato “mapa de bits”:
Arquivos em formato “mapa de bits”: como reconhecer um caracter? A a A a A a a a A ? ? ? ? ?
Processo de digitalização A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨ Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII
Processo de digitalização Imagens são formadas por pontos Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade podem ser controladas na tela. As imagens são formadas com a combinação de grande número de pixels. O termo é usado para referir-se a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels). Pixels são representados por 1 ou mais “bits” Bitonal ou preto-e-branco: 1 bit por pixel: pontos pretos: “1” pontos brancos: “0” Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por pixel) Colorido 8 bits por pixel: 256 cores 12 bits por pixel : 4096 cores 24 bits por pixel : 16.800.000 cores (“true color”)
Correspondência Arquivo “mapa-de-bits”, imagem na tela do computador Imagem na Tela 10 X 20 Arquivo “mapa-de-bits” 0000000000 0000000000 0000000000 0111111110 0100000010 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0000000000 0000000000 0000000000 0000000000
Processo de digitalização - RESOLUÇÃO Relação entre número de pontos de uma imagem (Pixels) / Área Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada A resolução é uma medida da LEGIBILIDADE de uma imagem
Processo de digitalização - RESOLUÇÃO Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes.
Processo de digitalização RESOLUÇÃO - aplicação da digitalização em DOCUMENTOS Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi) Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la Resolução razoável para documentos: 300 dbi
Processo de digitalização Como não existe um código único para cada caracter, as imagens dos caracteres são desenhadas! A a A a A a a a A a, nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo
Processo de digitalização Os sistemas de gerenciamento de imagens eletrônicas de documentos – GED - associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca. Estes sistemas são a combinação das tecnologias de bancos de dados com a digitalização de documentos através do uso de escaners Imagem digitalizada de um documento Tipo | Num. | Setor | Data | Assunto | Registro de um banco de dados: pontos de acesso para recuperação