A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.

Apresentações semelhantes


Apresentação em tema: "Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L."— Transcrição da apresentação:

1 Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.

2  Introdução  Estimação de densidade  Janela de Parzen  Exemplo  kernel Gaussiano  Perguntas

3  O método de Kernel é utilizado para estimar a densidade em um ponto x.  A função densidade de probabilidade é um conceito fundamental em estatística. Um ponto x com uma função de distribuição F(x) é dita continua quando F(x) = ∫ (-∞ -> x) p(t) d(t), neste caso p seria a função densidade de x e deve satisfazer ∫ (-∞ -> +∞) p(x) d(x) = 1.  Especificar a função densidade de x nos fornece uma descrição natural da sua distribuição, e permite que probabilidades associadas a x possam ser encontradas através da relação: F(a b) p(x) d(x) para todo a < b.

4

5  A função densidade de probabilidade da distribuição normal com os parâmetros média μ e variância σ 2.  Estimador Kernel não utiliza parâmetros.  não segue uma distribuição normal  ou não possui elementos suficientes para afirmar isso.

6  A probabilidade de um ponto x estar dentro de uma região R i, utilizando uma função densidade p(x) é dada por:  Probabilidade (x) = ∫ Ri p(x) d(x)  Considere a região R i continua e pequena a tal ponto onde p(x) não varia. Então podemos reescrever a formula:  Probabilidade (x) = ∫ Ri p(x) d(x) = p(x) * V  Onde V é o volume de R i.

7  Podemos definir a probabilidade de x estar na região R i como:  Probabilidade (x) = k/n  Onde k é o numero de pontos na região R i e n é o numero de pontos visando toda a região R;  Como a Probabilidade (x) = p(x)*V, então:  p(x)*V ≈ k/n  p(x) ≈ (k/n) / V

8

9  Em problemas reais existem duas alternativas para estimação da densidade:  Escolher um valor fixo de k e determinar o volume V a partir dos dados.  Fixar o volume V e determinar k a partir dos dados (Janela de Parzen).  p(x) ≈ (k/n) / V

10

11  Nesta abordagem fixamos o tamanho da região R para estimar a densidade, fixamos o volume V e determinamos o correspondente k a partir dos dados de aprendizagem e assumimos que a região R é um híperplano de tamanho h cujo volume é h d.

12  Assim para estimar a densidade no ponto x simplesmente centramos R em x, contamos o número de observações em R e substituímos na equação.  p(x) ≈ (k/n) / V  Exemplo:  Considere a região 1D, onde há 6 pontos distribuídos nela. Definido a região R = 10 (em vermelho), onde o ponto verde representa seu centro. Calcula-se a densidade um ponto, que esteja dentro desta região.

13  Função de Kernel (φ(u)): Estimador probabilístico não paramétrico (não utiliza média e desvio padrão como parâmetro).  I(|u| < 1) retorna 1 se verdade ou ø se falso. Kernelφ(u) Uniforme½ * I(|u|< 1) Triangular(1-|u|) * I(|u|< 1) Epanechnikov ¾*(1 – u 2 ) 2 * I(|u|< 1) Quadrático15/16 * (1 – u 2 ) 2 * I(|u|< 1) Triweight35/32 * (1 – u 2 ) 3 * I(|u|< 1) Cossenoπ/4 * cos(π/2 * u) * I(|u|< 1)

14 Utilizando a Função de Kernel Uniforme.

15  Demonstrando um exemplo com a Função de Kernel Uniforme. Considere.  u = (x – x i )/ h, onde x é o centro da região R, x i é um ponto qualquer. Se x i estiver dentro do hiperplano então φ retorna 1, se x i não estiver dentro do hiperplano então retorna ø.

16  Janela de Parzen em 1D. Considere a região com a seguinte amostra, X = {2, 3, 4, 8, 10, 11, 12}.  A fórmula para estimar a densidade do ponto x na região R é:  P φ (x) = 1/n * ∑ (1 -> n) 1/h d * φ (x – x i /h )

17  Vamos estimar a densidade em x = 1 e usando h = 3. Repare que o número de pontos n = 7.  Lembrando em uma dimensão h = h d.

18  Estimando todas as densidades.  A janela é usada na realidade para interpolação, cada ponto x i contribui para o resultado da densidade em x, se x está perto bastante de x i

19 Utilizando a Função de Gauss e gerando a Janela de Gaussiana.

20  Muda apenas a função Kernel, que passa a ser:  Usando o mesmo exemplo onde X = {2, 3, 4, 8, 10, 11, 12}, porem com h = 1. a Janela Gaussiana seria:

21  Para estimar corretamente o tamanho da região. Observe o que acontece quando se utiliza poucos pontos e h pequeno.

22  Agora com muitos pontos e h pequeno.

23


Carregar ppt "Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L."

Apresentações semelhantes


Anúncios Google