A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Joaquim Macedo Departamento de Informática da Universidade do Minho &

Apresentações semelhantes


Apresentação em tema: "Joaquim Macedo Departamento de Informática da Universidade do Minho &"— Transcrição da apresentação:

1 Joaquim Macedo Departamento de Informática da Universidade do Minho &
Fundamentos de Áudio Joaquim Macedo Departamento de Informática da Universidade do Minho &

2 Sumário Características do Som O Sistema de Audição Humano
Gravação de Áudio Representação do Sinal Áudio Método da Forma de Onda Musical Instument Digital Interface Distribuição do TPC nº2

3 O que é o som? Fenómeno físico produzido pela vibração da matéria
Cordas de Violino, Bater palmas ,Cordas vocais Com a vibração da matéria as moléculas vizinhas vibram no ar criando um variação de pressão no ar à volta Esta alteração das altas pressões (compressão) e baixas pressões (rarefacção) propaga-se no ar como uma onda Quando a onda atinge o nosso ouvido e processado pelo cérebro o som é ouvido O som é um fenómeno físico produzido pela vibração da matéria tal como as cordad dum volino, um bater de palmas ou as cordas vocais. Conforme a matéria vibra, as moléculas vizinhas no ar vibram num movimento tipo mola criando variações de pressão no ar envolvente.

4 Ondas Sonoras compressão rarefacção Onda sinusoidal amplitude tempo
Esta alteração de alta pressão (compressão) e baixa pressão (rarefação) é propragada atraés do ar como uma onda.

5 O que é o som? Uma onda sonora produz áreas de alta e baixa pressão
Quando a onda de alta pressão atinge o timpano ele move-se para dentro Quando a onda de baixa pressão atinge o timpano ele move-se para fora. Quando a onda atinge o ouvido humano é processado pelo ouvido e o som é ouvido.

6 Ondas Sonoras Uma onda mecânica é uma perturbação que viaja através dum meio transportando energia dum local para outro. O som propaga-se como uma onda de um local para o outro....

7 Características do Som
Propriedades normais das ondas Reflexão Refração Difração A percepção do som inclui três aspectos: Intensidade (amplitude); Tom (frequência); e, Envelope (Timbre) Porquê que o violino e o piano a tocar a mesma nota são tão diferentes? O som tem as propriedades normais das ondas como reflexão, refracção e difracção. E tem as várias propriedades com a frequência, intensidade e a forma de onda.

8 Reflexão e Refração Quando há velocidades diferentes de transmissão da onda ocorre a refração

9 Difração Quando o comprimento de onda é da ordem de grandeza do diâmetro do objecto. A onda reflectida está desfazada com a onda creeping. Ocorre quando o comprimento de onda é similar ao diâmetro do objecto.

10 Características do Som Frequência
O comprimento de onda (wavelength) é a distância entre dois pontos adjacentes na onda A frequência é uma característica importante do som. É o número de ciclos de alta-para-baixa pressão que ocorrem num segundo.Na música, a frequência é conhecida como tom, que é a nota musical criada por um instrumento.

11 Características do Som Frequência
A frequência da onda é o número de comprimentos de onda por ciclo (normalmente um segundo) É medida em Hertz (ondas por segundo) Quanto maior a frequência maior é o tom 1 wave 2 waves t 0 secs time sec 2 Hz

12 Características do Som Frequência
Categoria Gama de Frequência Intra Som 0 –20 Hz Som Audível 20 Hz- 20 KHz Ultra Som 20 KHz - 1GHz Hiper Som 1 GHz - 10 GHz A gama de frequências do som pode ser dividida nas seguintes quatro categorias (ver tabela).

13 Características do Som Frequência
Limite da Gama Audível Homem 20 KHz Cão 50 KHz Gato 60 KHz Morcego KHz Golfinho KHz Diferentes animais têm capacidades diferentes para ouvir os sons de lata frequência.

14 Características do Som Frequência
Gama audível para os humanos 20 Hz- 20KHz Diminui com a idade Meia idade < 15 KHz Ondas sonoras Velocidade: 344 m/s (temperatura 20ºC) Comprimentos de onda 17 m (20 Hz) 1.7 cm (20 KHz) As pessoas conseguem ouvir sons entre entre 20 Hz e 20 KHz. Esta gama é a frequência audível. A banda de frequência audível varia de pessoa para pessoa. Para além disso a resposta do ouvido a altas frequências deteriora-se com a idade. O som propaga-se aproximadamente a 340 m/s no ar a temperatura de 20ºC. Assim os comprimentos de onda são os indicados no slide.

15 Características do Som Frequência
Diferentes composições do som Natural Fala Música Categorias de sons Periódicos Não periódicos Há diferentes composições de som tal como som natural fala e música. O som pode ser também dividido em duas categorias: periódico e não periódico. Os sons periódicos são repetitivos por natureza e incluem o sibilar do vento, cantos dos pássaros, e os sons gerados por instrumentos musicais. Os sons não periódicos incluem incluem a fala, espirros e a cair da água...A maioria dos sons são combinações complexas de ondas com diferentes frequências e formas de onda...Assim, o espectro dum sinal de áudio típico contém uma ou mais frequências fundamentais, as suas harmónicas e eventualmente as respectivas produtos das modulações cruzadas. A maioria das frequências fundamentais dum onda de som são abaixo dos 5 KHz. Assim ondas sonoras entre 5-15Khz consistem de harmónicas. As harmónicas são normalmente menores em amplitude quando comparadas com as frequências fundamentais. Portanto a densidade de energia dum espectro áudio está normalmente fora das altas frequências. Esta característica é explorada pelos algoritmos de compressão. As harmónicas e respectiva amplitude determinam o timbre do som e permitem distinguir sons de diferentes fontes tal como voz, piano ou guitarra.

16 Características do Som Amplitude
Intensidade Exemplos Típicos 0 dB Limiar da audição 25 dB Estúdio de Gravação 40 dB Residência 50 dB Escritório 70 dB Conversação Típica 90 dB Audição áudio em casa 120 dB Limiar da dor 140 db Música Rock A intensidade ou amplitude do som corresponde ao barulho que chega aos nossos ouvidos. Para gravação ou reprodução de soma intensidade é expressa de duas formas. Primeiro pode ser medido como um nível acústico que é a intensidade percebida pelo ouvido. Em segundo lugar pode ser medida comum nível elétrico depois do som ser convertido em sinal elétrico. Ambas as intensidades são expressas em decibéis (dB) que é uma medida relativa. A intensidade acústica do som é geralmente medida em termos do nível de pressão do som. Intensidade do som (em dB) = 20 log(P/Pref) Onde P é a potência custica do som medida em dynes/cm2 e Pref é a intensidade do som no limiar da audição Pref= d/cm2, valor típico. Assim este valor é usado para medir a intensidade do som. Observe-se que o ouvido humano é essencialmente insensível a níveis depressão abaixo de Pref. A tabela no slide mostra os níveis de intensidade para vários sons naturais. A intensidade dum sinal áudio pode também ser medido em termos do nível de potência elétrica. Intensidade do som (em dBm) = 10 log (P/Po) Onde P é a potência do sinal áudio e Po= 1 mW. Note que o sufixo m no dBm é porque é medido relativamente a 1 mW.

17 Características do Som Envelope
Uma importante característica do som é o seu envelope. Quando o som é gerado, não dura para sempre. A ascensão e a descida da intensidade do som (ou nota musical) é chamado como seu envelope. Um envelope típico tem quatro secções: o ataque, o declínio, a sustentação e terminação. Durante o ataque, a intensidade da nota aumenta desde o silêncio até o nível mais alto. A seguir diminui para um nível médio onde é mantida durante um período de tempo. Cai desde o nível médio até zero durante o período de largar. Cada instrumento musical tem um envelope diferente. As notas do violino têm ataques lentos mas um longo período de sustentação enquanto uma nota de guitarra têm um ataque rápido e uma terminação longa. A fala é certamente uma das categorias mais importantes de som multimédia. Para uma análise eficiente da fala é necessário compreender os princípios do sistema vocal humano, que é para além dos objectivos deste curso. Aqui estamos mais interessados em representar de forma eficiente e efectiva da representação da fala e para fazê-lo é útil compreender as propriedades do sistema humano de audição. É isso que vamos fazer a seguir.

18 Sistema de Audição Humana
Mecanismo deveras complexo! Através dos ouvidos é realizada a captação das mais diversas formas de som Os nossos ouvidos transformam o som em sinais que são processados pelo nosso cérebro Vamos fazer uma descrição ligeira do nosso sistema de audição O ouvido e o sistema nervoso associado é um sistema interactivo complexo. Através dos anos, o sistema auditivo humano o SAH evoluiu incrivelmente na potência de percepção.

19 Sistema de Audição Humana
O nosso sistema auditivo converte energia sonora em energia mecânica para um impulso nervoso que é transmitido para o cerébro. O ouvido tem três partes: externa, média e interna. Uma visão simplificada do ouvido humano é mostrado na figura. O ouvido está dividido em três partes: a externa, a média e a interna.

20 Sistema de Audição Humana
O ouvido externo O ouvido externo compreende o pavilhão auricular e o meato acústico externo. O pavilhão capta os sons, tendo papel importante na localização espacial da fonte sonora, extremamente importante para ouvirmos em ambientes ruidosos. O meato acústico externo conduz os sons até a membrana timpânica. Converte o som (enregia acústica) em vibrações (energia mecânica) como o diagrama dum microfone. O canal do ouvido atinge a ressonância a cerca de 3 KHz, disponibilizando sensibilidade extra para a gama de frequências crítica para a inteligibilidade da fala.

21 Sistema de Audição Humana
Ouvido médio Serve para transformar a energia sonora em vibrações internas do estrutura óssea da orelha média As vibrações são transformadas em ondas de compressão O ouvido médio compreende a membrana timpânica, a cadeia de ossículos (martelo ,bigorna e estribo) e os espaços aéreos do osso temporal, particularmente o antro mastóide e as células mastóideas adjacentes. O martelo a bigorna e o estribo disponibilizam a adaptação de impedância para conversão de sons do meio gasoso para o meio líquido do ouvido interno. O ouvido médio desempenha o papel de um transformador, que evita a perda de energia das ondas sonoras ao passar de um meio gasoso (ar) a um meio líquido (a perilinfa da orelha interna).

22 Sistema de Audição Humana
O ouvido interno Serve para transformar a energia da onda de compressão num fluído interno do ouvido em implusos do nervo no fluído interno que podem ser transmitido ao cérebro A membrana basilar detecta a amplitude e a frequência dos sons. Essas vibrações são convertidas em impulsos eléctricos e enviados para o cérebro como impulsos no nervo. Para determinar a frequência, o cérebro descodifica o período do estímulo e o ponto de máximo estímulo através da membrana basilar. Um exame detalhado da membrana basilar mostra que que contem, grosso modo, células capilares organizadas em filas, que tem aproximadamente 32 mm de comprimento

23 Sistema de Audição Humano
Ouvido é um sistema altamente complexo Tem as suas ideossincrasias Altamente sensível a defeitos a sinais atractivos Ignora defeitos graves em sinais assumidos como irrelevantes Essas propriedades podem ser exploradas para obter níveis de compressão elevados no armazenamento e transmissão de sinais áudio.

24 Sistema Humano de Audição Curvas de Igual Intensidade
Foi descoberto que a sensibilidade do ouvido não é idêntico ao longo de todo o espectro áudio (20Hz-20KHz). A figura mostra resultados experimentais com o sistema de auditivo humano usando tons de sinusóides. Os sujeitos eram pessoas na sua maioria com 20 anos de idade. Primeiro foi produzido um ton sinusoidal de 1 Khz e 20 dB de intensidade e foi registado nível de ruído. A seguir produziram-se sons a outras frequências e foi mudada a amplitude para se conseguirem tons idênticos. A amplitude nas outras frequências deu lugar à segunda curva a contar de baixo. A experiência foi repetida a 40,60,80,100 e 120 dB. As curvas de igual tom mostram que o ouvido não é linear com respeito à frequência e tom. A curva mais abaixo a tracejado reprenta o campo mínimo audível (Minimum Audible Field) do ouvido humano. Estas curvas permitem observar que o ouvido é mais sensível na gama de frequência entre 1kHz e 5KHz. O comportamento de ressonância da membrana basilar é similar ao comportamento de um analizador de transformadada. De acordo com o princípio de incerteza das transformadas há um compromisso entre a resolução no tempo e na frequência. O SAH desenvolveu um compromisso entre a resolução na frequência e no tempo. A resolução imperfeita no tempo apareceu devido à resposta de ressonância do ouvido. Descobriu-se que um som deve ser mantida pelo menos durante um 1ms antes de se tornar audível. Paa além disso, mesmo se o som deixa de existir, a sua ressonância afecta a semsibilidade à audição de um novo som durante cerca de 1ms.

25 Efeito de dissimulação
Quando um som forte numa determinada frequência estimula os pelos da cóclea As frequências próximas não são ouvidas caso sejam menos significativas (de menor amplitude) Apesar do nosso ouvido captar uma certa amplitude de frequências, parte delas não são processados por causa do processo de dissimulação(masking)

26 Sistema Humano de Audição Dissimulação Áudio
80 Sinal 70 60 50 Limiar da Dissimulação (Masking) 40 Nível de Pressão do Som [dB-SPL] 30 Limiar da Audição 20 Devido à imperfeição da resolução na frequência, o ouvido não consegue descriminar frequências com espaçamento próximo. Por outras palavras, a sensibilidade dum som é reduzido em presença de outros sons com contéudos similares na frequência. O fenómeno é designado como dissimulação auditiva e é ilustrada na figura acima. A resolução na frequência do ouvido não é uniforme ao longo do espectro áudio. A sensibilidade é alta às baixas frequências e diminui às altas frequências. Nas baixas frequências, o ouvido pode distinguir sons separados poucos Hz. Contudo, a altas frequências, os tons têm que deferir centenas de Hz. Por esse facto, o ouvido humano pode ser considerado um analisador de espectro com bandas logarítmicas. 10 5000 10000 15000 -10 Frequência -20 -30

27 Sistema Humano de Audição Bandas Críticas
Nº Banda Crítica Frequência Corte Inferior (Hz) Frequência Corte Superior(Hz) Banda Crítica (Hz) Frequência Central (Hz) 1 --- 100 ---- 50 2 200 150 3 300 250 4 400 350 5 510 110 450 6 630 120 570 7 770 140 700 8 920 840 9 1080 160 1000 10 1270 190 1170 11 1480 210 1370 12 1720 240 1600 Resultados experimentais mostram que o espectro pode ser dividido em várias bandas críticas. Aqui, uma banda crítica significa uma banda de frequências que é suposto ser dissimulada por um tom forte com a frequência central da banda. Pode-se observar na tabela que a banda crítica para um tom de 1 KHz é cerca de 160Hz. Isto significa que que um ruído ou sinal de erro que esteja na gama de cerca de 160 Hz só é audível se for mais forte.

28 Sistema Humano de Audição Bandas Críticas
Nº Banda Crítica Frequência Corte Inferior (Hz) Frequência Corte Superior(Hz) Banda Crítica (Hz) Frequência Central (Hz) 13 1720 2000 280 1850 14 2320 320 2150 15 2700 380 2500 ...

29 Sistema Humano de Audição Som mestre e dissimulados
80 70 60 Som mestre 50 Limiar da Dissimulação (Masking) 40 Nível de Pressão do Som [dB-SPL] 30 Limiar da Audição 20 Quando se combinam a sensibilidade à frequência com as propriedades de dissimulação, obtém-se o limiar de audição mostrado na figura Qualquer sinal áudio cuja amplitude seja inferior ao limiar de audição é inaudível ao ouvido humano. 10 5000 10000 15000 -10 Sons dissimulados Frequência -20 -30

30 Gravação Áudio Som gerado e reproduzido de várias formas
Fala : pessoa para pessoas Não há processamento Música e Radiodifusão Processamento e armazenamento Para posterior busca e reprodução Ouvintes Fonte

31 Acústica Som Fonte de Som Ouvintes Ambiente
O som envolve tipicamente uma fonte de som, um ouvinte e o ambiente. O som é geralmente reflectido dos objectos envolventes. O ouvinte ouve o som relectido e o enviado pela fonte. Estas outras componentes do som são designados por ambiência. A ambiência é provocado pela reflexão em espaços fechados como salas de espectáculos. Num espaço pequeno há reflexões múltiplas, nenhuma das quais se atrasa o suficiente para ser designado por eco (que é uma repetição discreta dum som), mas continuam a circular no recinto até serem extintos devido à absorção parcial que ocorre em cada reflexão. Por exemplo quando se diz “Olá” num auditório vazio daí a pouco ouve-se “ola-a-a-a”. Este fenómeno é conhecido como reverbação. A reverbação contribui para a sensibilidade do espaço e é importante para a reprodução do som. Por exemplo se o som for dirigido directamente do instrumento musical sem reverbação parece morto. Isto pode ser corrigido adicionando reverbação artificial que pode ser feito com processamento digital. Ambiente

32 Acústica Reverbação

33 História do Áudio Multicanal
Décadas Principais acontecimentos 1930 Experiência com 3 canais áudio nos Laboratórios Bell 1950 4-7 canais (cinema) 2 canais stereo (casa) 1970 Stereo ambiente (cinema) 4 canais stereo (casa) Cassetes vídeo mono e stereo 1980 3-4 canais áudio de ambiente (casa) CD digital 2 canais (casa) 1990 5 canais áudio ambiente (casa) Já foi feita uma breve introdução ao sistema auditivo humano anteriormente. Quando o som chega aos ouvidos, o cérebro descodifica os dois sinais resultantes e determina a directividade do som. Historicamente, a gravação e a reprodução do som começou com um simples canal áudio, conhecido como áudio mono. Contudo, descobriu-se que a diretividade do som poderia ser bastante aumentada se se usasse dois canais. O audio com dois canais é geralmente chamado stéreo e é largamente utilizado nas indústrias de gravação e difusão. Os canais são chamados o esquerdo (Left-L) e direito (Right-R), correspondentes à localização dos altifalantes para reprodução. O conceito de usar dois canais é natural pelo facto de termos dois ouvidos. Durante muito tempo e ainda hoje es´tá muita gente convencida que pelo facto de termos dois ouvidos precisamos dum máximo de dois canais. Contudo, os investigadores concluiram que mais canais (ver tabela no slide) podem melhorar ainda mais a experiência espacial do som. Desde 1940 que usam 4 ou mais canais de som no cinema. Contudo, o audio quadrifónico foi introduzido para as aparelhagens domésticas apenas em Não se tornaram populares pela dificuldade de gravar quatro canais nas cassetes áudio usando a tecnologia analógica disponível. Foi descoberto que uma reprodução mais realista do som pode ser obtida tendo um ou mais canais de reprodução que emitam som por trás do ouvinte. Este é o princípio do som circundante usado em apresentações teatrais e recentemente popularizado com os sistemas de home cinema. Há uma larga variedade de configurações para arranjo dos altifalantes à volta do ouvinte.

34 Reprodução Áudio Multicanal
LFE LFE L-S R-S L-S R-S L-S R-S L-S R-S A mais popular actualmente para os sistemas de audição em casa é a que usa 5 altifalantes que emprega 5 canais com 3 altifalantes em frente e 2 atrás do ouvinte como se mostra na figura. Contudo para aplicações de cinema são necessários mais altifalantes de som ambiente em função do tamanho do cinema. L-S R-S Casa Cinema L (Left), R(right), C(center), L-S (Left-Surround), L-R(Right-Sorround), LFE (Low Frequency Effects)

35 Sistema de som ambiente Configuração dos altifalantes
Posição dos Altifalantes Nome Código F-L F-C F-R M-L M-R R-L R-C R-R Mono 1/0 Stereo 2/0 x 3c Stereo 3/0 3c amb. 2/1 4c amb. 2/2 Amb. standard 3/2 Ambiente Melhorado 5/2 A tabela no slide mostra que o som de ambiente normalizado com 5 canais completos de áudio (até 20KHz de LB). Contudo, foi observado que é adicionando um canal de pouca largura de banda (equivalente a 0.1), designado por LFE na figura do slide anterior. Estes sistemas são normalmente conhecidos com 5.1 canais e ficaram bastante populares para sistemas de áudio domésticos.

36 Gravação áudio ao vivo (a) (b) (c) Gravador Stereo Amplificador
Instrumentos Colunas (b) Misturador Gravador Multi-pista Instrumentos Misturador A figura (a) mostra um esquema dum sistema stereo simples apropriado para gravação de música. As ondas de som são apanhados por dois microfones e convertidos em sinais eléctricos. A qualidade de som resultante é afectada pela escolha dos microfones e sua localização. O gravador de duas pistas grava os canais separados em duas pistas diferentes. Para a reprodução o sinal gravado é alimentado ao amplificador que a seguir os coloca em duas colunas. A figura (b) mostra uma gravação áudio mais completa com vários microfones. Aqui, cada microfone é colado próximo de cada cantor ou instrumento. Para conseguir uma gravação balanceada, todos os microfones são ligados a um misturador que pode controlar individualmente o volume do sinal vindo de cada microfone. A saída do misturador pode ser gravada numa cassete com várias pistas para futura edição, mas a edição do som requer a reprodução repetida para o ajustamento dos componentes individuais.Uma vez completado o processo de edição o sinal áudio pode ser gravado numa cassete stéreo ou mono (figura (c)). A vantagem do áudio multi-pista é a flexibilidade.Uma pista pode ser ligada ou desligada durante a gravação e a reprodução. Considere um cenário onde, depois dum espéctaculo gravado em estúdio, o sinal de pinao não combina bem com os outros componentes. Só com uma ou duas pistas era necessário repetir todo o espectáculo. Assim, basta fazer um nova gravação com o pianista. (c) Gravador Multi-pista Gravador Stereo Efeitos

37 Representação do Sinal de Áudio
Métodos Considerações Complexidade do processamento Taxa de informação Flexibilidade Forma de Onda Representação exacta do sinal de áudio produzido Paramétrico Modelo do processo de geração Síntese de voz (para fala) Compressão da fala Síntese de música Norma MIDI

38 Forma de Onda: Geração e Reprodução Áudio
Ouvinte Fonte Áudio Reprodução (Altifalante) Captura Áudio Conversão D/A Amostragem & Digitalização Armazenamento ou Transmissão Receptor Um esquema de geração e reprodução de áudio está ilustrado na figura do slide. Neste método, são usados um ou mais microfones para converter a energia acústica em energia eléctrica. A tensão produzida é então amostrada e quantificada. O áudio digital produzido é armazenado num ficheiro ou transmitido a um receptor para reprodução imediata. Quando está a ser reproduzido, o áudio digital é convertido numa tensão analógica variável no tempo que é aplicada a um ou mais altifalantes. O som é assim reproduzido para audição. No sentido de obter a qualidade desejada no sinal de áudio reproduzido, os diferentes componentes da figura têm que ser concebidos adequadamente. Neste curso vamos concentrar-nos nos princípios envolvidos na amostragem, digitalização e armazenamento.

39 MIDI Musical Instrumental Digital Interface
Não transmite áudio digital Transmite informação básica produzida pelo músico Que teclas são pressionadas ou libertadas Que pedais são pressionados ou libertados O som difere dos outros sons na forma em que pode ser gerado. Uma vez concebida a música pode ser tocada por outros músicos, usando a respectiva pauta. Isto levou ao desenvolvimento duma norma conhecida como Musical Instrumental Digital Interface , MIDI. Nesta norma, um certo trecho musical é representado por uma sequência de números que especificam como é que os instrumentos musicais devem ser tocados nos diferentes instantes de tempo. Um estúdio MIDI normalmente tem os seguintes componentes:

40 Especificação MIDI O MIDI é fisicamente :
Uma interface série assíncrona simplex Simplex – os dados fluem numa única direcção do transmissor para o receptor Série – os bits de dados são transmitidos uns atrás dos outros Assíncrona – a duração de cada bit é fixa (32 µs para o MIDI). Tanto o transmissor como o receptor necessitam dum relógio preciso para medir essa duração. Não é transmitido nenhum relógio, pelo que só é necessário um par de fios. Baud rate = bits/second Dados transmitidos em pacotes de 8 bits com 1 bit de start e stop sem paridade.

41 Conexões MIDI A maioria dos dispositivos MIDI têm 3 portas:
MIDI In: Recebe Informação MIDI MIDI Out: Transmite Informação MIDI MIDI Thru: Repete a entrada ‘MIDI In’ Permite uma única saída MIDI controlar mais que um instrumento IN OUT THRU IN OUT THRU IN OUT THRU A B C

42 Sistema MIDI simples Sequenciador Módulo de Som Sinal MIDI Controlador
Um estúdio MIDI tem normalmente os seguintes subsistemas: Controlador: Um dispositivo de execução musical que gera um sinal MIDI quando tocado. Um sinal MIDI é simplesmente uma série de números que codificam uma série de notas. Sintetizador: Um teclado tipo piano que simula o som de instrumentos musicais reais. Geralmente cria som electronicamente com osciladores. Sequenciador: Um dispositivo ou programa de computador qu grava um sinal MIDI correspondente a um espectáculo musical. Módulo de Som: Um dispositivo que produz amostras pré-gravadas quando disparado por um controlador ou sequenciador MIDI. A figura no slide mostra um sistema MIDI quando a música está a ser tocada por um músico num controlador MIDI (isto é um teclado). Conforme o músico toca no teclado, o controlador envia o correspondente código detalhando a sequência de eventos para criar a música. O código é recebido pelo módulo de som que tem vários geradores de som. Esses geradores de som correspondentes aos diferentes instrumentos musicais tal como piana guitarra e tambores. Quando os geradores de som sintetizam sons de acordo com o sinal MIDI e o correspondente sinal elétrico é enviado para os altifalantes, nós ouvimos o som da música. O Módulo de som pode também ligado a um sequenciador que grava o sinal MIDI, que pode ser guardado numa disquete, CD ou disco rígido. Controlador

43 Estúdio Virtual Computer Mixer Digital Audio Track MIDI Sequence
Audio In Audio Out Digital Audio Track Microphone Audio Out MIDI In MIDI Sequence MIDI Out MIDI In Audio Out MIDI Out

44 Organização de ficheiro MIDI
Track 1 Track 2 Header Chunk ... Track 1 Header Track 1 Chunk Track 2 Header Track 2 Chunk Dados da Música Status Byte Data Bytes Status Byte Data Bytes A figura do slide mostra a organização em bits do ficheiro MIDI. O ficheiro começa com um cabeçalho que é seguido pela informação correspondente às pistas. Cada pista tem um cabeçalho e um corpo

45 Formato do cabeçalho e pista
Deslocamento Comp Tipo Descripção Valor 0x00 4 char[4] ID do chunk MThd(0x4D546864) Header 0x04 dword Tamanho chunk 6(0x ) Chunk 0x08 2 word Tipo formato 0-2 0x10 Nº pistas 1-65,535 0x12 div. tempo Ticks/quadro Track MTrk (0x4D54726B) Tamanho dados da pista Dados de eventos No slide é mostrado o formato dos dados do cabeçalho e da pista. O cabelçalho contém sempre o ChunkId que é “MThd”. Isto é seguido pelo tamanho do chunk, tipo de formato, número de pistas e uma divisão do tempo. Há três tipos de ficheiros MIDI normalizados Tipo 0 – Combina todas as pistas ou pautas numa única pista Tipo 1 – Guarda os ficheiros como pistas ou pautas separadas para uma partitura completa com a informação de tempo e assinaturas do ritmo apenas incluída na primeira pista Tipo 2- Guarda os ficheiros como pistas ou pautas separadas para uma partitura completa com a informação de tempo e assinaturas do ritmo incluídas em todas pistas. A sequência do cabeçalho também contém a divisão do tempo, que define a unidade de tempo delta por defeito para este ficheiro MIDI. A divisão do tempo é um valor de 16 bits, que pode estar num de dois formatos, dependendo do valor do bit mais significativo. Se o MSB for 0, os bits 0-14 representam os número de unidades de tempo delta em cada semínima. Contudo de o MSB for 1, os bits 0-7 representam o número de unidades delta de tempo por cada quadro SMTPE e os bits 8-14 formam um número negativo que representa o número de quadros SMTPE por segundo (ver tabela no slide seguinte). O chunk da pista contém um identificador de chunk (ID normalmente MTrk ) tamanho do chunk e dados de eventos da pista. Os dados de eventos da pista contém uma cadeia de eventos MIDI e define informação aceca da sequência e como é tocada. É a música que nós ouvimos. A informação de controlo da música e o valor de ajuste da modulação dos canais MIDI são definidos como eventos do canal MIDI. Existem três tipo de eventos: Eventos de Controlo, Eevntos exclusivos do sistema e Meta Eventos.

46 Formato de Informação para Divisão no Tempo
Bit: 15 <Divisão> Ticks por semínima 1 Frames/seg Ticks/frame

47 Mensagens MIDI Tudo que a interface física MIDI permite é a transmissão de mensagens de 8 bits Para tocar música, é necessária uma linguagem ou protocolo para associar semântica aos números O MIDI usa mensagens de um ou mais bytes A maioria das mensagens usam 2 ou 3 bytes no formato seguinte: Status Byte Data Byte 1 Data Byte 2 1 Message Type Channel No. Data 1 (0-127) Data 2 (0-127)

48 Byte de estado e canais MIDI
Status Byte Data Byte 1 Data Byte 2 1 Message Type Channel No. Data 1 (0-127) Data 2 (0-127) Todas mensagens MIDI começam com o byte de estado O MSB para o byte de estado é 1 para os restantes é 0 Os Bits 4,5 and 6 do byte de estado indicam o tipo de mensagem (8 tipos possíveis) Os 4 bits restantes indicam o # do canal Os dispositivos MIDI podem ser configurados para responder a um único canal

49 Formato de eventos de canais MIDI
Tempo Delta Valor do tipo de evento Canal MIDI Parâmetro 1 Parâmetro 2 Comprimento Variável 4 bits 1 byte O formato dos eventos do cala MIDI está mostrado no slide. Já foi dito que cada evento de canal MIDI consiste dum tempo delta de comprimento variável e 2-3 bytes de descrição que determinam a que canal MIDI ele corresponde de que tipo de eventose trata e um ou mais valores específicos do evento.

50 Polyphonic Aftertouch
Eventos de Canal MIDI Valor Tipo Evento Parâmetro 1 Parâmetro 2 0x8 Note Off Note Number Velocity 0x9 Note On 0xA Polyphonic Aftertouch Pressure 0xB Control Change Controller Number Value 0xC Program Change Program Number (not used) 0xD Channel Aftertouch 0xE Pitch Bend LSByte MSByte Nesta tabela são apresentados um conjunto seleccionado de eventos MIDI, o seu valor numérico e respectivos parâmetros.

51 Note On/Off Status Byte Data Byte 1 Data Byte 2 1 0/1 Channel No. Note Number (0-127) Velocity (0-127) Off/On C3 60 D3 62 E3 64 F3 65 G3 67 A4 69 B4 71 A#4 70 G#3 68 F#3 66 D#3 63 C#3 61 C2 48 D2 50 E2 52 F2 53 G2 55 A3 57 B3 59 A#3 58 G#2 56 F#2 54 D#2 51 C#2 49 No MIDI, um novo evento é gravado armazenado uma mensagem Note On. A velocidade indica a força com a qual a tecla é pressionada que por sua vez correspone ao volume com que a nota é tocada. Contudo, especificar a velocidade 0 para o evento Note On é o mesmo que o evento Note Off. Muitos ficheiros MIDI usam este método uma vez que maximiza o modo de corrida, onde um comando pode ser omitido e o comando prévio é assumido. Observe que quando um dispositivo recebe a mensagem Note Off, a nota não termina abruptamente. Alguns sons, tal como o orgão e trompete fazem-no. Outros como os sons de guitarra e paino, extinguem-se suavemente em vez disso, embora mais rapidamente depois de recebidoa a mensagem note-off Quando se pressiona uma tecla, é transmitida uma mensagem note-on Quando se liberta uma tecla, é transmitida uma mensagem note-off

52 Exemplo Acção Menagem MIDI Saída MIDI No key pressed Nothing Idle
F3 Held Nothing Idle F3 pressed Note On, F3, Velocity=100 , , (144, 65, 100) F3 released Note Off, F3, Velocity=55 , , (128, 65, 55)

53 Mudança de Controlo Status Byte Data Byte 1 Data Byte 2 1 1 1 Channel No. Controller Number (0-127) Value (0-127) Para além do teclado, vários outros parâmetros afectam o som, como por exemplo o regulador de volume, o suster do pedal, modulação, etc... Quando qualquer desses parâmetros é ajustado é transmitido o novo valor usando uma mensagem de mudança de controlo O nº de controlo identifica o parâmetro a ser alterdo (i.e. 1 = modulação, 7 = volume) O valor pode ser: Um número entre 0 e 127 para controladores contínuos 0 ou 127 para comutadores off/on

54 Mudança de Programa Status Byte Data Byte 1 1 1 Channel No. Program Number (0-127) A maioria dos instrumentos electrónicos são capazes de produzir uma variedade de sons Os diferentes sons são armazenados em memória e são conhecidos como programas (ou arranjos, vozes, etc)... Para seleccionar um som diferente é transmitida uma mensagem de mudança de programa Trata-se duma mensagem de 2 bytes

55 Outras mensagens Pós toque (Aftertouch) Mudança de tom
Pós toque polifónico Quando uma tecla é pressionada, a forca com que é pressionada pode ser detectada por sensores de pressão- conhecido como aftertouch Pós toque de canal O pós toque polifónico mede a pressão de cada tecla. O pós toque de canal mede a pressão de todo teclado Mudança de tom Um controlador especial que muda subtilmente o tom de todas notas tocadas num canal. Mensagens de sistema Várias mensagens específicas do sistema relacionadas com a temporização e reprogramação de sintetizadores

56 Aplicações preliminares
Nos primeiros dias do MIDI, a maioria dos programas tinham um polifónico limitado e tocavam apenas uma voz (arranjo/programa) de cada vez. Usando mais que um instrumento e conexões MIDI os artistas podem: Construir sons mais complexos misturando várias vozes Criar partituras (keyboard splits) e extinções de sons (cross-fades) Controlar sintetizadores com diferentes instumentos MIDI (i.e. pedais, guitarras, clarinetes, violinos etc.)

57 Instrumentos Multi-Timbre
OUT THRU IN OUT THRU IN OUT THRU IN OUT THRU Etc. Master Channel 1 Channel 2 Channel 3 (ii) Synthesiser Channel 1 Single Multi-timbral synthesiser IN OUT THRU Synthesiser Channel 2 Master Synthesiser Channel 3 Etc.

58 MIDI Genérico Na especificação inicial MIDI, não foram feitos pressupostos acerca dos instrumentos utilizados em termos de: Número de alocações de programa Controladores Polifonia (# notas tocadas em simultâneo) Um sintetizador MIDI genérico está de acordo com a especificação: Nomes de Programas e controladores fixos 16 canais multi-timbre 64 notas de polifonia Canal 10 reservado para tambores

59 Protocolo MIDI Permite a comunicação entre os mais diversos equipamentos Computadores, sintetizadores, teclados, outros equipamentos musicais É atribuído um número a cada dispositivo musical A maioria das músicas convencionais podem ser representadas eficientemente usando o MIDI A qualidade do som produzido depende do equipamento de reprodução


Carregar ppt "Joaquim Macedo Departamento de Informática da Universidade do Minho &"

Apresentações semelhantes


Anúncios Google