A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

INF01124 – Classificação e Pesquisa de Dados

Apresentações semelhantes


Apresentação em tema: "INF01124 – Classificação e Pesquisa de Dados"— Transcrição da apresentação:

1 INF01124 – Classificação e Pesquisa de Dados
Compressão de Áudio INF01124 – Classificação e Pesquisa de Dados Afonso Comba de Araújo Neto 0052/99-7 Francisco José Prates Alegretti 1433/99-1 Natália Nunes Pinto Lopes 2667/99-4 Rodrigo Gasparoni Santos 3072/99-8

2 Tópicos Analisados Introdução Digitalização do Som Compressão de Sons
Análise dos Formatos MP3 TwinVQ AAC Comparações entre os formatos Conclusões

3 Introdução Formatos de Áudio não comprimido: Formatos comprimidos
Wave File - *.WAV (mais conhecido) Formatos comprimidos MPEG Layer III - *.MP3; Windows Media Audio - *.WMA; Advanced Audio Coding - *.AAC; Real Audio - *.RA; TwinVQ - *.VQF; ... e muitos outros.

4 Digitalização do Som Som = onda.
Digitalização consiste em amostrar a onda um de terminado número de vezes por unidade de tempo, codificando a sua amplitude. Quanto mais amostras por unidade de tempo, e quanto maior a escala de quantização de amplitudes, melhor a fidelidade do som amostrado.

5 Digitalização do Som Uma boa amostragem de som é definida como o dobro do período máximo de variação de sua amplitude. Portanto, um som que possui uma variação de amplitude média de 10KHz deve ter sua amostragem feita a uma taxa de 20KHz.

6 Digitalização de Som Portanto:
Voz humana pode ser amostrada a uma taxa de 11KHz; Uma música inteira deve ser amostrada a uma taxa de 44KHz. 16 bits por amostra foi identificado como a quantização ideal para um som fidedigno.

7 Digitalização de Som Qualidade de CD então é definida como uma amostragem de 44KHz, 16 bits por amostra.

8 Compressão de Sons A compressão de sons é um procedimento complexo, pois ondas amostradas raramente possuem padrões, que são utilizados nos métodos de compressão tradicionais.

9 Compressão de Sons Existem então dois principais tipos de técnicas de compressão: Compressão dos dados propriamente ditos (ex. Huffman coding); Eliminação de sons imperceptíveis ao ouvido humano. As técnicas de eliminação de sons imperceptíveis são as que realmente produzem resultados.

10 Compressão de Sons Essa técnica é uma técnica de compressão com perdas, ou seja, o arquivo final é diferente do original. De qualquer forma, qualquer método de compressão sem perdas, especificamente no caso de sons não consegue uma taxa de compressão maior do que 2:1 ou 3:1.

11 Compressão de Sons Um arquivo em Qualidade de CD a esta taxa de compressão possui um tamanho inviável, chegando a uma média de 8 a 10 megabytes por minuto. Sendo assim, as técnicas de compressão de som aqui vistas, entre outras, são sim de muita valia.

12 Análise dos formatos Vamos fazer uma breve descrição de como funciona a compressão de alguns dos formatos mais comuns, sendo eles: MPEG-1 Layer III; TwinVQ; Advanced Audio Coding (AAC).

13 MP3 MP3 é o formato mais conhecido e difundido no mundo.
Suas principais vantagens são: Pouco consumo de CPU para tocar um arquivo; Tamanho de arquivo muito pequeno; Qualidade muito próxima à original.

14 MP3 Utiliza, resumidamente, as seguintes técnicas para diminuir a quantidade de dados de um arquivo: The minimal audition threshold; The masking effect; The reservoir of bytes; The Joint Stereo; The Huffman coding.

15 The minimal audition threshold
Segundo a lei de Fletcher e Munson, somente ondas na faixa de 2KHz até 5KHz são importantes para o som (em uma música, por exemplo), pois fora desta faixa são praticamente imperceptíveis, sendo então não codificadas.

16 The masking effect Esta etapa da compressão identifica sons muito fracos que ficam mascarados por outros muito mais fortes. Estes então são removidos do conjunto. Nesta etapa é onde o conjunto de sons começa a realmente ficar menor.

17 The reservoir of bytes A mp3 é na verdade codificada de modo a utilizar uma taxa de amostragem que não garante o tempo todo a melhor qualidade de som. Ao invés disso, é utilizada uma amostragem que possibilita a codificação de uma parte considerável da música, e os trechos que necessitam de maior qualidade têm sua codificação estendida em uma área reservada de dados.

18 The Joint Stereo Esta parte faz dois procedimentos:
Primeiro, identifica todas as partes do conjunto onde ambos os canais são iguais ou muito parecidos e os codifica como um canal mono; Depois, são identificadas todas as partes stereo que sobraram e, ao invés de codificar os canais R e L, codifica L+R e L-R, o que no final utiliza menos bits

19 The Joint Stereo Opcionalmente, ao primeiro procedimento são salvos dados extras que possibilitam a reconstrução dos canais R e L sem perdas. Tanto essa reconstrução quanto a identificação dos canais R e L originais codificados pelo segundo passo são feitos em tempo de execução pelo Player.

20 The Huffman coding Finalmente, utiliza-se da técnica de codificação desenvolvida por Huffman para as amostras finais, que agora são muito mais padronizadas, tendo um ganho de até 20% no tamanho do arquivo.

21 CD x MP3 Bitrate Qualidade Kbyte/Min Tamanho 1411 CD 10584 41,3 MB
192 Perfeita ,6 MB 160 Perfeita ,7 MB 128 Excelente ,8 MB 112 Quase CD ,3 MB 96 Quase CD ,8 MB 64 FM ,9 MB 32 AM ,9 MB 16 Reconhecível ,5 MB

22 TwinVQ Formato relativamente novo, que até ganhou algum destaque devido a sua boa qualidade e ao seu tamanho de arquivo menor (25% menor que o MP3). Entretanto necessita de um computador muito mais potente para rodar as músicas satisfatoriamente.

23 TwinVQ Outro fator decisivo para a sua queda é a sua necessidade que um tempo muito maior para codificação. Por exemplo, comparado com um compressor MP3 esse tempo é de 3 até 4 vezes maior. Na verdade, isso é o que garante o tamanho de arquivo menor, como veremos a seguir.

24 TwinVQ A compressão para vqf utiliza-se de características de codificação perceptual assim como o mp3. A principal diferença é a sua codificação. Os dados depois de comprimidos são organizados em vetores de segmentos de padrões, que são depois comparados com vetores já existentes.

25 TwinVQ São codificadas então somente a identificação destes vetores, diminuindo o tamanho do espaço necessário para a codificação. Daí que surge a sua necessidade de mais poder de computação para sua codificação/decodificação. O resultado é um som bem mais limpo, mas com uma perda um pouco maior de detalhes.

26 TwinVQ Mesmo assim, o som obtido no final é bastante parecido com o original. Portanto, normalmente não se considera que a codificação vqf é melhor ou pior que a mp3, ela é simplesmente diferente. A tecnologia TwinVQ faz parte do padrão MPEG 4 para codificação de sons.

27 Advanced Audio Coding Formato com padronização MPEG-2.
É a mais nova padronização de codificação perceptiva de sons feita pela MPEG. Utiliza um sistema complexo de codificação que envolve inúmeras técnicas.

28 Advanced Audio Coding Entre outras, algumas delas são: Huffman coding;
Quantization and scaling; M/S Matrixing; Intensity Stereo; Coupling channel; Backward adaptive prediction; Temporal noise shaping; Modified discrete cosine transform; Gain control and hybrid filter bank (polyphase quadrature filter).

29 Advanced Audio Coding Assim como o formato vqf, necessita de um computador mais rápido para codificação e para decodificação que o mp3. Entretanto, dos 3 formatos é o que possui a melhor qualidade final (mais próximo do original).

30 Advanced Audio Coding Possui um tamanho de arquivo aproximado ao do vqf. Um dos seus maiores problemas é a existência de várias versões do padrão, incompatíveis diretamente entre si (possuem significativa diferença de codificação). Faz parte, junto com o vqf, do padrão MPEG-4.

31 Comparações entre os formatos
Tamanho do arquivo Disponibilidade de software Disponibilidade de músicas Consumo de CPU Qualidade do som O melhor formato Algumas conclusões

32 Tamanho do arquivo Comparação com o wav original

33 Tamanho do arquivo Comparação entre os formatos

34 Tamanho do Arquivo

35 Disponibilidade de software

36 Disponibilidade de músicas

37 Consumo de CPU OBS.: Os testes foram feitos em um Pentium 133MHz

38 Qualidade do Som

39 O melhor formato

40 Conclusões Vale lembrar que a escolha de um melhor formato é subjetiva. Pode-se chegar a resultados diferentes se considerarmos itens com pesos distintos. Apesar da menor qualidade, a maior popularidade do mp3 está ligada a maior quantidade de músicas e softwares disponíveis. Certamente não sairá de cena tão cedo.

41 Bibliografia http://www.mp3-tech.org


Carregar ppt "INF01124 – Classificação e Pesquisa de Dados"

Apresentações semelhantes


Anúncios Google