A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Processamento de Sinais

Apresentações semelhantes


Apresentação em tema: "Processamento de Sinais"— Transcrição da apresentação:

1 Processamento de Sinais
Prof. Dr.-Ing. João Paulo C. Lustosa da Costa Universidade de Brasília (UnB) Departamento de Engenharia Elétrica (ENE) Laboratório de Processamento de Sinais em Arranjos Caixa Postal 4386 CEP , Brasília - DF Homepage:

2 Processamento de sinais de áudio (1)
O problema da festa do coquetel: é a matriz de mistura (desconhecida); é a matriz de símbolos ou de sinais (desconhecida); é a matriz de dados com amostras (conhecida); Deseja-se encontrar , dado apenas Premissas: Os sinais seguem uma distribuição não Gaussiana; Os sinais são independentes e não correlacionados; e são misturados linearmente e instantaneamente. Observação: Na prática, em aplicações com sinais de áudio, os sinais são misturados de forma convolutiva e não de forma instantânea.

3 Processamento de sinais de áudio (2)
Independência versus Ortogonalidade versus não correlação Sejam x e y dois vetores não nulos, então: x e y são linearmente independentes se e somente se existir a seguinte relação não for satisfeita para qualquer constante a x e y são ortogonais se e somente se x e y são não correlacionados se e somente se Fonte: J. L. Rodgers, W. A. Nicewander, and L. Toothaker, „Linearly Independent, Orthogonal, and Uncorrelated Variables“, The American Statistician, Vol. 38, 1984.

4 Processamento de sinais de áudio (3)
Os símbolos da i-ésima fonte de sinal são dados por: em que tem média zero e variância unitária enquanto que tem média e variância Consequentemente a matriz de símbolos é dada por: em que and e é a matriz cujos elementos na i-ésima linha são iguais a Devido à premissa de que os sinais são independentes, então:

5 Processamento de sinais de áudio (4)
Preparação dos dados para a Análise de Componentes Independentes (ICA) Estimando a média em cada linha da matriz X em que é um elemento da matriz X na posição (m,n). Estimando a variância para cada linha da matriz X Transformação dos elementos das linhas da matriz X em média zero e variância unitária para m = 1, ..., M Obtém-se então a matriz X´

6 Processamento de sinais de áudio (5)
Branqueamento da matriz X´ Cálculo da matriz de covariância das amostras Aplicando a Decomposição em Autovalores (EVD) A matriz de branqueamento é então definida como sendo Aplicando a matriz de branqueamento, obtém-se: ou Z corresponde à matriz S´ rotacionada!

7 Processamento de sinais de áudio (6)
Maximizando a não Gaussianidade Do teorema do limite central: a média aritmética de um número suficientemente grande de iterações de variáveis aleatórias independentes com médias e variâncias bem definidas será aproximadamente uma distribuição normal. A fim de separar os sinais misturados, usa-se como critério a maximização da não-Gaussianidade. Consequentemente, a ICA não pode ser aplicadas se os sinais originais forem distribuídos de forma Gaussiana! Para o sinal Gaussiano real, tem-se que a Curtose, Logo, pode-se medir a Gaussianidade de uma variável aleatória por meio de uma função dada pela Curtose: Se a variável aleatória s é Gaussiana, então: Se a variável s é não Gaussiana e tem variância unitária, então:

8 Processamento de sinais de áudio (7)
Maximizando a não Gaussianidade Exemplo de função

9 Processamento de sinais de áudio (8)
Maximizando a não Gaussianidade Cálculo dos filtros por meio do método do gradiente, do inglês gradient descent, também conhecido como método da descida mais íngreme, do inglês steepest descent Atualização dos filtros iterativamente utilizando uma função custo O método do gradiente é definido pela seguinte função como: em que indica o tamanho do passo para convergência da função, J(n) é a função custo que pretende ser maximizada ou minimizada e é a função filtro que se deseja encontrar. Note que se for muito pequeno a convergência levará mais iterações e se for maior que o valor ideal, então a função não irá convergir. No caso da ICA, a função custo é

10 Processamento de sinais de áudio (9)
Maximizando a não Gaussianidade Aplicando o método gradiente, tem-se: em que é 1 se o argumento for positivo e -1 se o argumento for negativo, Note que z tem média zero e variância unitária e o mesmo é válido para y, que é a variável de saída do filtro.

11 Processamento de sinais de áudio (10)
Exemplo de aplicação da ICA d = 3 sinais Os sinais originais possuem a seguinte forma.

12 Processamento de sinais de áudio (11)
Exemplo de aplicação da ICA d = 3 sinais Os sinais misturados possuem a seguinte forma.

13 Processamento de sinais de áudio (12)
Exemplo de aplicação da ICA d = 3 sinais Os sinais misturados após preparação e branqueamento possuem a seguinte forma.

14 Processamento de sinais de áudio (13)
Exemplo de aplicação da ICA d = 3 sinais Os sinais separados após encontrar a convergência da matriz de filtros W.

15 Processamento de sinais de áudio (14)
Exemplo de aplicação da ICA Aproximação da FDP dos sinais originais por meio dos histogramas. Nenhum dos sinais possui uma distribuição Gaussiana. Logo, ICA pode ser aplicada para separá-los! Curtose: : Subgaussiana (senóide) : Supergaussiana : Subgaussiana (triangular)

16 Processamento de sinais de áudio (14)
Exemplo de aplicação da ICA Variação da função baseada na Curtose a cada iteração. Triangular Senóide

17 Processamento de sinais de áudio (15)
Mistura de sinais sonoros A representação matemática é dada por uma mistura convolutiva linear. Fonte 1 Sinal misturado 1 Fonte 2 Sinal misturado 2 Fonte 3 Sinal misturado 3

18 Processamento de sinais de áudio (16)
Mistura de sinais sonoros Microfone 1 Modelo convolutivo Superposição de Q fontes Microfone P Sistema de mistura H

19 Processamento de sinais de áudio (17)
Mistura de sinais sonoros Microfone 1 Microfone P Sistema de separação W

20 Processamento de sinais de áudio (18)
ICA Convolutiva ICA instantânea apenas para misturas instantâneas, ou seja, para sinais banda estreita. Os sinais sonoros são sinais com banda extremamente larga, pois estão na faixa da banda básica. Logo, trata-se de um problema de misturas convolutivas. A transformada de Fourier de tempo curto, do inglês short-time Fourier transform (STFT), permite transformar o tempo (amostras) em duas dimensões que são tempo (quadros) e frequência. A STFT é uma técnica de Análise Tempo–Frequência, do inglês Time–Frequency Analysis (TFA). Após a STFT, um único sinal sonoro (banda larga) é transformado em F sinais banda estreita. Logo, após a STFT, F ICA instantâneas podem ser aplicadas para os F sinais banda estreita.

21 Processamento de sinais de áudio (19)
ICA Convolutiva Passo 1 da STFT: Segmentação com superposição (overlap) do sinal sonoro em quadros Janela de Hanning Passo 2 da STFT: Janelamento de cada quadro - Produto entre a janela escolhida e quadro é feito ponto a ponto no domínio do tempo.

22 Processamento de sinais de áudio (20)
ICA Convolutiva O janelamento reduz significativamente o vazamento espectral vide exemplo.

23 Processamento de sinais de áudio (21)
ICA Convolutiva Passo 3 da STFT: Quadros são transformados para o domínio da frequência aplicando a Transformada Discreta de Fourier em cada quadro. A ICA convolutiva então pode ser representada da seguinte forma: Janelamento e segmentação ICA instantâneo p/ f = 1 FFT IFFT Ajuste de permutação para os d sinais nas F frequências. Janelamento e segmentação ICA instantâneo p/ f = F FFT IFFT STFT para cada microfone Após a IFFT, é feita a transformação inversa ao janelamento e à segmentação simplesmete superpondo cada quadro em um único vetor.

24 Processamento de sinais de áudio (22)
ICA Convolutiva Exemplo de histogramas de sinais sonoros, em geral, com distribuições Laplacianas.

25 Processamento de sinais de áudio (23)
ICA Convolutiva Ambiente de teste com duas fontes sonoras e com um arranjo de microfones.

26 Processamento de sinais de áudio (24)
ICA Convolutiva Exemplo com 2 sinais misturados Sinais antes da mistura Sinais misturados Sinais após a separação usando o TRINICON

27 Processamento de sinais de áudio (25)
Reconhecimento de Locutor Uma vez que os sinais foram separados, o desempenho das técnicas de reconhecimento de locutor pode melhorado. Para o reconhecimento de locutor, utiliza-se usualmente os Coeficientes Cepstrais nas Frequências de Mel, do inglês Mel Frequency Cepstral Coefficients (MFCC). Note que, após o ajuste de permutação da ICA convolutiva, cada matriz tempo-frequência do sinal obtido pode ser utilizada no cálculo dos MFCC. Estimar energia do espectro Banco de filtros Segmentação e janelamento Computar DCT Computar logaritmo Locutor Coeficientes cepstrais

28 Processamento de sinais de áudio (26)
Reconhecimento de Locutor Exemplo de energia do espectro do sinal segmentado Módulo do quadrado da amplitude do sinal Componente de frequência

29 Processamento de sinais de áudio (27)
Reconhecimento de Locutor Banco de filtros

30 Processamento de sinais de áudio (28)
Reconhecimento de Locutor Banco de filtros - exemplo Fixar extremos em Hertz e converter para Mels; fs = 16 kHz 300 Hz e 8000 Hz  401,25 Mels e 2834,99 Mels

31 Processamento de sinais de áudio (29)
Reconhecimento de Locutor Banco de filtros - exemplo 10 pontos equidistantes

32 Processamento de sinais de áudio (30)
Reconhecimento de Locutor Banco de filtros - exemplo Centralizar triângulos nos pontos internos

33 Processamento de sinais de áudio (31)
Reconhecimento de Locutor Banco de filtros - exemplo Conversão para escala Herz

34 Processamento de sinais de áudio (32)
Reconhecimento de Locutor Banco de filtros - exemplo Conversão para escala Herz

35 Processamento de sinais de áudio (33)
Reconhecimento de Locutor Banco de filtros - exemplo

36 Processamento de sinais de áudio (34)
Reconhecimento de Locutor Cálculo do logaritmo

37 Processamento de sinais de áudio (35)
Reconhecimento de Locutor Cálculo da DCT Falante 1 Falante 3 – Tempo 1 Cepstrum diferente! Mesmo Cepstrum! Falante 2 Falante 3 – Tempo 2

38 Processamento de sinais de áudio (36)
Reconhecimento de Locutor Coeficientes Cepstrais

39 Processamento de sinais de áudio (37)
Reconhecimento de Locutor Busca iterativa para encontrar parâmetros (média, variância e amplitude) das Gaussiana por meio do algoritmo EM


Carregar ppt "Processamento de Sinais"

Apresentações semelhantes


Anúncios Google