A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula 4 Bioestatística Probabilidade para variáveis aleatórias.

Apresentações semelhantes


Apresentação em tema: "Aula 4 Bioestatística Probabilidade para variáveis aleatórias."— Transcrição da apresentação:

1 Aula 4 Bioestatística Probabilidade para variáveis aleatórias

2 Probabilidade Discreta Noções de probabilidade discreta, distribuições usuais e análise exploratória padrão.

3 Calculando Probabilidades Existem três maneiras usuais de atribuir probabilidades aos resultados de um fenômeno aleatório: 1 – Resultados Equiprováveis 2 – Frequências Relativas 3 – Ajuste de Modelos

4 Exemplo Dois dados são lançados. Os 36 resultados possíveis são mostrados abaixo. Considere que cada um deles tem a mesma probabilidade, igual a 1/36. Dado 1 Dado 2 123456 1(1,1)(1,2)(1,3)(1,4)(1,5)(1,6) 2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6) 3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6) 4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6) 5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6) 6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)

5 Resultados Equiprováveis Suponha que existem M resultados possíveis. Como todos os eventos devem ter a mesma probabilidade, temos que cada evento tem probabilidade 1/M. Exemplo: em um dado de seis lados, a probabilidade de sair o número 5 é 1/6.

6 Resultados Equiprováveis O caso dos eventos equiprováveis surge mais em jogos de azar. Na vida real, é complicado dizer se todos os resultados são equiprováveis.

7 Frequências Relativas Seja A o resultado de um experimento. Se pudermos repetir esse mesmo experimento em iguais condições, seja n (A) o número de vezes que A ocorreu em n repetições do experimento (ou seja, em uma amostra de tamanho n ). Então A expressão n (A)/ n é denominada frequência relativa de A e será denotada por fA. O termo n (A) é denominado frequência absoluta de A.

8 Exemplo: Lançando uma Moeda Vamos lançar uma moeda várias vezes e contar quantos caras saem. Abaixo mostramos uma parte dos resultados Lançamento n (Caras) n (Caras)/ n 1º00,0 2º00,0 3º10,33 4º10,25 5º20,40 6º20,33 7º20,29

9 Exemplo: Lançando uma Moeda Clique para editar os estilos do texto mestre Segundo nível Terceiro nível Quarto nível Quinto nível

10 Exemplo: Lançando uma Moeda Lançamos a moeda 1.000 vezes. Podemos notar que o valor n (A)/ n parece se “comportar melhor” a medida que n cresce. Os picos do início desaparecem e o padrão começa a ficar mais regular. Além disso, o valor n (A)/ n se aproxima da linha azul pontilha, indicando que n (A)/ n se aproxima de ½. Esse comportamento não foi obtido por sorte: ele é fruto de um teorema denominado Lei Forte dos Grandes Números.

11 Tabela de Frequências Podemos organizar todas as frequências em uma tabela, denominada tabela de frequências.

12 Exemplo: Nº de vítimas fatais Seja X a variável aleatória que conta o número de vítimas fatais em um acidente aéreo. Abaixo, segue a tabela do nº de vítimas fatais por acidente aéreo ocorrido no Brasil em 2008. X0123456Total n (X)1279121311154 fX 0,8250,0580,0780,0060,0190,007 1

13 Exemplo: Nº de vítimas fatais Podemos agregar os últimos valores da tabela, somando as frequências, conforme mostra a tabela abaixo: Isso melhora a visualização. Entretanto, não há como saber quais foram os 6 valores maiores ou iguais a 3. X012≥3Total n (X)1279126154 fX 0,8250,0580,0780,0331

14 Gráfico de Barras É um gráfico das frequências relativas. Cada resultado possível é representado por uma barra. A altura da barra é determinada pela frequência relativa. Nota: o gráfico feito utilizando a frequência absoluta será o mesmo, só que em escala diferente.

15 Gráfico de Barras: Vítimas Fatais Clique para editar os estilos do texto mestre Segundo nível Terceiro nível Quarto nível Quinto nível

16 Os mesmos gráficos de barras Clique para editar os estilos do texto mestre Segundo nível Terceiro nível Quarto nível Quinto nível

17 Gráficos de Setores Também é um gráfico de frequências relativas. Considere uma variável categórica com k categorias. Um gráfico de setores é um círculo dividido em k setores circulares, cada um com área proporcional à proporção de elementos em cada setor.

18 Exemplo de Gráfico de Setores

19 Setores ou Barras  Podemos criar um gráfico de setores para uma variável discreta. Também podemos criar um gráfico de barras para uma variável categórica. Qual é o melhor 

20 Setores ou Barras TipoSetoresBarras DiscretaUsar apenas se houverem poucos valores possíveis. Sempre recomendado CategóricaSempre recomendado.Usar quando a variável for ordinal.

21 Mais sobre Tabela de Frequências Em uma tabela de frequência, não é obrigatório mostrar a frequência absoluta. Entretanto, é obrigatório mostrar o tamanho da amostra.

22 Exemplo:mucajaí Óbitos por causa básica em Mucajaí/2008.

23 Exemplo: Mucajaí Mucajaí: 15.000 habitantes Houveram três mortes registradas em 2008, todas no mesmo dia envolvendo um acidente de carro: um motorista e dois passageiros. O tamanho da amostra evitaria conclusões precipitadas.

24 Função de Distribuição Empírica (FDE) Também é conhecida como frequência acumulada, por motivos que ficarão claros mais adiante. Serve para estimar a probabilidade de que a variável em questão seja menor ou igual que algum certo valor.

25 Função de Distribuição Empírica (FDE) Cálculo da Função de Distribuição Empírica: Passo 1. Calcule todas as frequências relativas (vamos chamá-las de f1, f2, f3,...). Passo 2. F1 = f1 Passo 3. F2 = F1+f2 Passo 4. F3 = F2 + f3 Passo 5. F4 = F3 +f4... Continue até ter usado todas as frequências relativas

26 Exemplo Considere a seguinte amostra de X: 1,1,1,1,1,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4. Interpretações: a probabilidade (estimada) de ocorrer 2 é de A probabilidade (estimada) de ocorrer um resultado menor ou igual a 3 é X1234Total F. Absoluta546520 F. Relativa5/204/206/205/201 FDE5/209/2015/2020/20

27 Gráfico da FDE Uma vez que a função de distribuição empírica está bem definida, podemos fazer seu gráfico. Serve para comparação.

28 Exemplo: Dados de Agrassão

29 Exemplo: Dados de Agressão

30 Variável Contínua Noções de variável contínua, o modelo normal, o modelo t.

31 Noções de Variável Contínua Existe um problema para variáveis contínuas: P(x)=0 para qualquer x. Na verdade, quando dizemos que duas pessoas tem a mesma altura, digamos 1,76m, na verdade estamos observando apenas as duas casas decimais que o instrumento de medida permitiu. É possível que essas alturas sejam números do tipo 1,761245829385921029384...

32 Noções de Variável Contínua Não podemos calcular P(x) para uma variável contínua. Entretanto, podemos calcular a probabilidade de intervalos, áreas volumes... Definimos a probabilidade de um intervalo como a proporção da área ocupada pelo intervalo considerando todo o espaço possível. Exemplo. Um ponto ( x, y ) é escolhido ao acaso dentro do quadrado unitário. Qual a probabilidade de...

33 ... x< 1/2 

34

35 ... x x.

36

37 Função de Densidade Notemos que, no exemplo anterior, todas as possíveis regiões são “cobertas” pelo quadrado unitário. Mas, na vida real, vamos calcular a área dentro de qual região  Existe uma função, denominada densidade. Ela representa a curva que cobre todas as probabilidades dos possíveis intervalos.

38 Histograma É um estimador para a densidade da variável. Para construí-lo Passo 1. Divida os valores observados em intervalos de mesmo comprimento. Passo 2. Construa uma tabela de frequências relativas, contando o número de pontos de cada intervalo. Passo 3. Faça um gráfico de barras a partir desta tabela.

39 Exemplo: Peso ao Nascer

40 Nota Sobre Histograma É comum utilizar um histograma para variáveis discretas (ou seja, construir uma tabela de frequências com intervalos). Entretanto, só é recomendável fazer isso se houverem muitos valores distintos na amostra. Caso contrário é melhor fazer um gráfico de barras.

41 Método do Núcleo É outro método para estimar o histograma. Vantagem: precisa de uma amostra menor para representar a verdadeira densidade. Ele consiste de uma espécie de média ponderada com uma outra densidade. Não é fácil construí-lo sem um computador.

42 Exemplo: Peso ao Nascer


Carregar ppt "Aula 4 Bioestatística Probabilidade para variáveis aleatórias."

Apresentações semelhantes


Anúncios Google