A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

C APÍTULO 3 C APÍTULO 3 I NTRODUÇÃO À P ROBABILIDADE E À I NFERÊNCIA E STATÍSTICA.

Apresentações semelhantes


Apresentação em tema: "C APÍTULO 3 C APÍTULO 3 I NTRODUÇÃO À P ROBABILIDADE E À I NFERÊNCIA E STATÍSTICA."— Transcrição da apresentação:

1 C APÍTULO 3 C APÍTULO 3 I NTRODUÇÃO À P ROBABILIDADE E À I NFERÊNCIA E STATÍSTICA

2

3 Um fenômeno aleatório tem resultados que não podemos predizer, mas que, não obstante, possui uma distribuição regular em uma grande quantidade de repetições.

4 UM EXEMPLO: Lançamento de uma moeda. Característica: Dois resultados possíveis: Cara ou Coroa Não é possível afirmar a priori qual o resultado que vai ocorrer no lançamento da moeda. É possível definir uma distribuição regular?

5 UM EXEMPLO: Lançamento de uma moeda. O que podemos entender como uma distribuição regular? Qual o comportamento da ocorrência de cada possível resultado em uma longa sequência de repetições do fenômeno, realizadas sob as mesmas condições. No Exemplo: Qual o comportamento do número de caras (ou de coroas) quando uma moeda é lançada um grande número de vezes.

6 Considere 5000 lançamentos de uma moeda. A cada lançamento determinar a proporção de caras (ou coroas) observadas até aquele lançamento. Por exemplo: Até o 10º lançamento, foi observado cara em 7 dos lançamentos realizados, logo a proporção de caras é de 0,7 (70%).

7 Considere 5000 lançamentos de uma moeda. Considere as duas situações a seguir: A: Ocorre as seguintes faces nos primeiros lançamentos: coroa, cara, coroa, coroa. B: Ocorre face cara em todos os 5 primeiros lançamentos.

8 Considere 5000 lançamentos de uma moeda. LOGO: Para o ensaio A, a proporção de caras inicia com zero no 1º lançamento, sobe para 0,5 quando no segundo lançamento dá uma cara, cai para 0,33 e 0,25 quando obtemos mais 2 coroas. Para o ensaio B, a proporção de caras é 1 até o 5º lançamento. O ensaio A inicia com poucas caras e o B com muitas.

9 Considere 5000 lançamentos de uma moeda. Consequentemente: A proporção de lançamentos com caras varia bastante no início. QUESTÃO: O que ocorre à medida que fazemos mais e mais jogadas?

10 Ensaio A Ensaio B

11 Considere 5000 lançamentos de uma moeda. CONCLUSÃO: O comportamento do acaso é imprevisível a curto prazo, mas tem um padrão regular e previsível a longo prazo. O resultado não pode ser predito antecipadamente. Porém, há um padrão regular nos resultados, um padrão que emerge após muitas repetições.

12 Considere 5000 lançamentos de uma moeda. Após uma longa sequência de lançamentos da moeda, a proporção de caras (consequentemente também de coroas) é aproximadamente 0,5 (50%).

13 Considere que: 1.Cada resultado possível de um fenômeno aleatório é um evento. 2.Os eventos têm diferentes atributos, ou seja, têm aspectos diferentes que os distinguem entre si. Definição 1: Se são possíveis n eventos mutuamente exclusivos e igualmente prováveis, se n A desses eventos tem o atributo A, então a probabilidade de A é dada pela razão n A / n.

14 Exemplo 1: Qual é a probabilidade de ocorrer face 6, quando se joga um dado equilibrado? Solução: Quando se joga um dado equilibrado, ocorre um de 6 eventos mutuamente exclusivos e igualmente prováveis; logo, a probabilidade de ocorrer face 6 é 1/6.

15 IMPORTANTE: É importante entender que a definição clássica de probabilidade não faz sentido a menos que possamos imaginar muitas repetições independentes do fenômeno. Quando dizemos que a probabilidade de sair cara num jogo de moeda é 1/2, estamos aplicando, a um único lançamento de uma única moeda, a medida de chance que teria sido obtida se tivéssemos feito uma longa série de jogadas.

16 Definição 2: Frequência relativa do evento A é a razão entre o número de vezes em que ocorreu A (n A ) e o número de eventos observados (n). IMPORTANTE: É importante entender que, se em uma longa sequência de repetições do fenômeno, nas mesmas condições, a frequência relativa de um evento se aproxima de um número fixo, esse número é uma estimativa da probabilidade do evento ocorrer.

17 Exemplo 2: Qual é a probabilidade de ocorrer face 6 quando se joga um dado que não é equilibrado (os seis eventos possíveis não são igualmente prováveis)? Solução: Se o dado não é equilibrado, para obter a probabilidade de ocorrer face 6 devemos lançar o dado um número suficientemente grande de vezes e dividir o número de vezes que saiu 6 pelo número de lançamentos feitos.

18 Exemplo 1: Fenômeno Aleatório: Lançamento de uma moeda. Ω = {cara, coroa} Evento: Face observada é cara. Definição 3: Ω = Espaço amostral: É o conjunto de todos os resultados possíveis de um fenômeno aleatório. Um evento é qualquer subconjunto do espaço amostral.

19 Exemplo 2: Fenômeno Aleatório: Lançamento de um dado. Ω = {1, 2, 3, 4, 5, 6} Evento 1: Face observada é SEIS. Evento 2: Face observada é ÍMPAR. Evento 3: Face observada é maior ou igual a 4. Evento 4: Face observada é PAR.

20 Exemplo 3: Fenômeno Aleatório: Um jogador de basketball faz três lances livre. Quais são as possíveis sequências de acertos (A) e erros(E)? Ω =??? Ω = {AAA, AAE, AEA, AEE, EAA, EAE, EEA, EEE} Note: 8 elementos, 2 3

21 Evento F: O jogador acerta os três lances; Evento G: O jogador erra dois lances; Evento H: O jogador acerta o segundo lance; P(F) = 1/8 P(G) = 3/8 P(H) = 4/8 Ω = {AAA, AAE, AEA, AEE, EAA, EAE, EEA, EEE} Note: 8 elementos, 2 3

22 Ω = {0, 1, 2, 3} Exemplo 3: Fenômeno Aleatório: Um jogador de basketball faz três lances livre. Qual o número de cestas feitas? Ω =??? P(0) = ?? P(1) = ?? P(2) = ?? P(3) = ??

23 Ω = [0, ] = (todos os números 0) Exemplo 4: Fenômeno Aleatório: Uma nutricionista pesquisa sobre uma nova dieta para alimentar ratos machos brancos. Quais são os possíveis resultados de ganho de peso (em gramas)? Ω = ???

24 Finitos ESPAÇOS AMOSTRAIS: Infinitos Dado: Ω = {1,2,3,4,5,6} Peso: Ω = [0, ] = (todos os números 0)

25 Questão: Como calcular probabilidades quando o espaço amostral é infinito (contínuo)? Exemplo: Densidade uniforme. A probabilidade de distribuirmos uniformemente a variável Y dentro de 0.3 e 0.7 é a área sob a curva de densidade correspondente a esse intervalo. Então: P(0.3 Y 0.7) = ( )*1 = 0.4 Existem muitos outros tipos de curvas de densidades.

26 Definição 4: Dois eventos são disjuntos (ou mutuamente exclusivos) se eles não tiverem nenhum resultado em comum, portanto nunca ocorrem juntos. A B = P(A B) = 0

27 Definição 5: Dois eventos são independentes se a probabilidade de um evento ocorrer em qualquer realização do experimento não muda a probabilidade de um outro evento ocorrer. Exemplo: No lançamento de uma moeda, o resultado do primeiro lançamento (cara, por exemplo) NÃO ALTERA a probabilidade de dar cara ou coroa no segundo lançamento.

28 Propriedade 1: A Probabilidade P(A) de qualquer evento A satisfaz 0 P(A) 1 Propriedade 2: A probabilidade do espaço amostral completo é igual a 1. P(Ω) = 1 Exemplo: P(cara) + P(coroa) = = 1 Propriedade 3: A Probabilidade de um evento não ocorrer é igual a 1 menos a probabilidade do evento ocorrer. P(A c ) = 1 – P(A) Exemplo: P(coroa) = 1 – P(cara) = 0. 5

29 Propriedade 4: Regra da adição geral para quaisquer dois eventos A e B: A probabilidade de que A ocorra, ou B ocorra, ou ambos eventos ocorram é: P(A ou B) = P ( A B) = P(A) + P(B) – P(A e B)

30 Propriedade 4: Exemplo: Qual é a probabilidade de selecionar aleatoriamente uma carta de um baralho de 52 cartas e ela ser um rei ou copas? Então: P(rei ou copas)= P(rei) + P(copas) – P(rei e copas) = 4/ /52 - 1/52 = 16/

31 Propriedade 5: A probabilidade condicional reflete como a probabilidade de um evento pode mudar se soubermos que algum outro evento tenha ocorrido. Exemplo: A probabilidade de que um dia nublado resulte em chuva é diferente se você vive no Nordeste ou se você vive no Sul do Brasil.

32 Propriedade 5: A probabilidade condicional do evento B dado o evento A é: (desde que P(A) > 0) A = Retirado um Rei B = Carta Retirada é de Copas Ex:

33 Se A e B são independentes: Desta forma, se A e B são independentes:

34 IMPORTANTE: A e B são independentes: A e B disjuntos ou mutuamente exclusivos:

35 CASO GERAL: REGRA DA MULTIPLICAÇÃO. Caso particular: A e B são independentes. A probabilidade de que quaisquer dois eventos, A e B, ocorram conjuntamente pode ser dada por: P (A e B) = P(A B) = P (A) P (B|A)

36 REGRA DA MULTIPLICAÇÃO: DIAGRAMA DE ÁRVORES O diagrama de árvores representa graficamente todos os possíveis resultados e apresenta as probabilidades condicionais de subconjuntos de eventos. Diagrama de árvores para hábitos de conversar em sites de bate-papo, para três grupos de idade adulta. Uso de Internet 0.47

37 Uso de Internet 0.47 Qual a probabilidade de encontrarmos um indivíduo que utiliza o bate-papo na internet? P(Utilizar e ter idade A1) + P(Utilizar e ter idade A2) + P(Utilizar e ter idade A3) = P(C A1) + P(C A2) + P(C A3) = P(A1) P(C/A1) + P(A2) P(C/A2) + P(A3) P(C/A3) = = 0.29 * * * 0.07 = = 0.252

38 No capítulo anterior definimos alguns procedimentos gráficos e numéricos para descrever o comportamento de uma dada característica (variável) presente no nosso estudo. Sob o ponto de vista da probabilidade, este comportamento da variável em estudo é definido como a distribuição da mesma. Na identificação da distribuição dos dados, vamos nos concentrar no estudo de variáveis quantitativas. Neste caso, o histograma se constitui num instrumento de grande importância na identificação de um modelo adequado aos dados.

39 Se traçarmos uma curva sobre o histograma observado podemos ter uma boa descrição geral dos dados. A curva obtida é um modelo matemático para a distribuição, ou seja, é uma descrição idealizada, que oferece uma imagem concisa do padrão geral dos dados, mas ignora irregularidades de menor importância, bem como a presença de valores atípicos.

40

41 ico na direção de ambas as caudas. A curva suave traçada através do topo das barras do histograma é uma boa descrição do padrão geral dos dados. A figura apresenta o histograma do peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma população. O peso apresenta uma distribuição muito regular. O histograma é simétrico e decresce suavemente a partir de um pico central único na direção de ambas as caudas. A curva suave traçada através do topo das barras do histograma é uma boa descrição do padrão geral dos dados.

42 A análise do histograma indica que: 1.a distribuição dos valores é aproximadamente simétrica em torno de 70kg; 2.a maioria dos valores (88%) encontra-se no intervalo (55; 85); 3.existe uma pequena proporção de valores abaixo de 48kg (1,2%) e acima de 92kg (1%).

43 Uma curva com uma forma apropriada é, geralmente, uma descrição adequada do padrão geral de uma distribuição. Evidentemente que nenhum conjunto de dados reais é descrito exatamente por uma dessas curvas, mas sim se constitui em uma boa aproximação de fácil utilização e com precisão suficiente para ser considerada na prática.

44 Sabemos que características (variáveis) em estudo para determinados problemas apresentam um mesmo padrão de comportamento. Portanto, estas variáveis podem ser aproximadas por uma mesma curva, exceto por seus valores de referência, como por exemplo, ponto central, dispersão...

45 Dizemos então que variáveis que apresentam um mesmo padrão de comportamento seguem um mesmo modelo (ou distribuição) de probabilidade. Um modelo de probabilidade pode então ser definido como uma descrição matemática de um fenômeno aleatório (ou variável aleatória, de maneira mais formal).

46 DOIS TIPOS DE MODELOS: MODELOS DISCRETOS MODELOS CONTÍNUOS

47 MODELOS DISCRETOS: Os modelos discretos são adequados a variáveis que podem assumir um número finito ou enumerável de valores. MODELOS CONTÍNUOS: São aqueles relacionados às variáveis que podem assumir infinitos valores.

48 Tipos de ModeloModeloCaracterística DiscretosBinomialVariável em estudo somente pode assumir dois possíveis valores em cada uma das n repetições do experimento e a probabilidade de ocorrência de cada um é constante. PoissonA variável observada identifica o resultado de uma contagem no experimento (número de insetos em uma determinada área, por exemplo). GeométricoNúmero de experimentos necessários até a ocorrência de um dado resultado de interesse. Binomial Negativa Número de experimentos necessários até a ocorrência de certo número de vezes do resultado de interesse. HipergeométricoVariável em estudo somente pode assumir dois possíveis valores em cada uma das n repetições do experimento e a probabilidade de ocorrência de cada um não é constante (usualmente experimentos sem reposição).

49 Tipos de ModeloModeloCaracterística ContínuosUniformeA variável pode assumir, com igual probabilidade, qualquer valor em um intervalo, região,... ExponencialA variável observa o tempo necessário até a ocorrência de um determinado resultado de interesse. NormalVariáveis com distribuições simétricas em relação a um ponto central. Outros Modelos: t de Student, Gama, Beta, Weibull, Erlang,.....

50 Observações: 1.Para determinadas situações, modelos discretos podem ser aproximados (representados) por um modelo contínuo. Por exemplo, num caso binomial em que o número de repetições do experimento é grande, pode-se analisar a variável em estudo pelo modelo normal. 2.Os modelos aqui apresentados referem-se à distribuição de uma única variável. Podemos em alguns casos ter interesse no comportamento conjunto de duas ou mais variáveis. Nesses casos, temos os chamados modelos multidimensionais ou multivariados, que não serão objetos de estudo nesse curso.

51 Muitos dos fenômenos que ocorrem na natureza, na indústria e nas pesquisas, apresentam características que podem ser representadas por um MODELO PADRÃO conhecido como MODELO OU DISTRIBUIÇÃO NORMAL. Medições físicas em áreas como experimentos meteorológicos, estudos sobre chuvas, medições de peças manufaturadas são explicadas de forma adequada pela distribuição normal e erros em medições científicas são bem aproximados pela distribuição normal.

52 CARACTERÍSTICA DO MODELO NORMAL: Os modelo padrão é resultado de uma curva aproximada do histograma dos dados, tem um único pico e apresenta uma forma de sino (simetria em torno do ponto de pico).

53 CARACTERÍSTICA DO MODELO NORMAL: A curva suave traçada através dos topos das barras do histograma, é uma boa descrição do padrão geral dos dados. A curva é um modelo matemático para a distribuição, ou seja, é uma descrição idealizada do padrão geral de uma distribuição.

54 Para dados X que podem ser representados pelo modelo acima, dizemos que: X ~ N ( ).

55 As distribuições Normais ou Gaussianas são famílias de distribuições simétricas, com a mesma forma geral. A curva de densidade é bem caracterizada por sua média (mi) e seu desvio padrão (sigma).

56

57 Algumas Diferentes Situações: Mesma média e diferentes variâncias (2, 4 e 6, respectivamente)!

58 Algumas Diferentes Situações: Mesma variância e diferentes médias (10, 15 e 20, respectivamente)!

59 PROPRIEDADES: X ~ N ( ) 1.E(X) = µ (média ou valor esperado); 2.Var(X) = 2 (e, portanto, DP(X) = ); 3.x = µ é ponto de máximo de f (x); 4.µ - e µ + são pontos de inflexão de f (x); 5.A curva Normal é simétrica em torno da média µ. 6.A distribuição Normal depende dos parâmetros µ e 2

60 IMPORTANTE: Embora haja muitas curvas Normais, todas têm propriedades em comum. Em particular todas as distribuições normais obedecem à seguinte regra: Na distribuição normal com média µ e desvio padrão : 68% das observações estão no intervalo ( µ - ; µ + ), 95,4% das observações estão no intervalo ( µ - 2 ; µ + 2 ), 99,7% das observações estão no intervalo ( µ - 3 ; µ + 3 ),

61 IMPORTANTE:

62 PROBLEMA: Um bom indicador do nível de intoxicação por benzeno é a quantidade de fenol encontrada na urina. A quantidade de fenol na urina de moradores de certa região segue, aproximadamente, uma distribuição normal de média 6 mg/L e desvio padrão 2 mg/L. Considere a seguinte definição em termos da variável quantidade de fenol na urina: Uma pessoa é considerada atípica se a quantidade de fenol em sua urina for superior a 9mg/l ou inferior a 3 mg/L.

63 QUESTÃO: Qual é a probabilidade de ser encontrado um indivíduo atípico? Seja X: quantidade de fenol encontrada na urina. Indivíduo Atípico Probabilidade desejada: Indivíduo com X 9 P [ X 9] = P[ X 9 ] = P[X 9]

64 Como calcular esta probabilidade, considerando que a variável de interesse pode ser representada pela distribuição normal? O cálculo de uma probabilidade na distribuição normal é dado pela área sob a curva normal na região de interesse, isto é, a área sob a curva de densidade fornece a proporção de observações que estão numa região de valores de interesse.

65 De forma genérica: P [ a < X < b ] ou P [ a X < b ] ou P [ a < X b ] ou P [ a X b ] A solução desta integral não é imediata. A solução é usualmente dada através de métodos numéricos.

66 Questão: Como calcular a probabilidade desejada sem a necessidade de resolver a integral acima apresentada? Resultado: Se X ~ N(µ ; 2 ), então: Chamada distribuição Normal Padrão.

67

68 IMPORTANTE: Probabilidades não se alteram!

69 Características na Normal Padrão: O escore padronizado z resultante diz de quantos desvios padrões cada valor x está afastado da média da distribuição. Quando x está 1 desvio padrão maior do que a média, então z = 1. Quando x está 2 desvios padrões acima da média, então z = 2. Quando x é maior do que a média, z é positivo. Quando x é menor do que a média, z é negativo.

70 De que forma a transformação da variável X em Z, normal padrão, facilita o cálculo de probabilidades? A solução desta integral é mais simples que no caso anterior, e seus valores estão tabelados.

71

72 Como utilizar esta tabela? SIGNIFICADO DOS VALORES TABELADOS

73 Por Exemplo: z = P[ Z < 0.32 ]= P[Z > 0.32] = 1- P[ Z < 0.32 ] = =

74 é a área sob a curva N(0,1) à esquerda de z = é a área sob a curva N(0,1) à esquerda de z = é a área sob a curva N(0,1) à esquerda de z = -2.46

75 Uma segunda situação: P [0 < Z < 1.71 ] = ? P(0 < Z < 1.71) = P(Z < 1.71) – P(Z < 0) = – 0.5 =

76 ALGUMAS DICAS PARA USO DA TABELA DA NORMAL PADRÃO Devido ao fato da distribuição Normal ser simétrica, há uma outra maneira para o cálculo da área sob a curva Normal padrão, que é à direita do valor z.

77 ALGUMAS DICAS PARA USO DA TABELA DA NORMAL PADRÃO Devido ao fato da distribuição Normal ser simétrica, há uma outra maneira para o cálculo da área sob a curva Normal padrão, que é à direita do valor z.

78 Retornando ao Problema Inicial X: a quantidade de fenol encontrada na urina. X ~ N (6 ; 2) P [ X 9] = P[X 9]

79 X ~ N (6 ; 2) P [ X 9] = P[X 9] Portanto, a probabilidade de ser encontrada uma pessoa considerada atípica é de 13.36%

80 Média µ = 64.5" Desvio padrão = 2.5" x : altura = 67" Para o cálculo de z, o valor padronizado de x: Área= ??? N(µ, ) = N(64.5, 2.5) = 64.5 x = 67 z = 0z = 1 Exemplo: Alturas de mulheres As alturas de mulheres têm distribuição aproximadamente normal, N(64.5,2.5). Que percentual de todas as mulheres têm altura menor ou igual a 67 polegadas?

82 O National Collegiate Athletic Association (NCAA) exige que atletas da 1 a divisão tenham pontuação de no mínimo 820 no SAT (Scholastic Aptitude Test ou Scholastic Assessment Test) combinado de matemática e verbal para competir no seu primeiro ano colegial. A pontuação SAT de 2003 foi aproximadamente normal com média 1026 e desvio padrão 209. Que proporção de todos os estudantes seriam qualificados (SAT 820)? Nota: Os dados reais podem conter estudantes que pontuaram exatamente 820 no SAT. No entanto, a proporção das pontuações exatamente igual a 820 é 0 para uma distribuição normal. É uma consequência da idealizada suavização das curvas de densidade. Área direita 820= Área Total Área a esquerda de 820 = %

83 Exercício: A vida de um semicondutor a laser, a uma potência constante, segue um modelo normal com média de 7000 horas e desvio padrão de 600 horas. a)Qual a probabilidade do laser falhar antes de completar 5000 horas? b)Qual deve ser o tempo de vida em horas de tal forma que 95% dos lasers excedem a esse tempo? c)Se três lasers forem usados em certo produto e se eles falharem independentemente, qual a probabilidade de todos os três estarem ainda operando após 7000 horas?


Carregar ppt "C APÍTULO 3 C APÍTULO 3 I NTRODUÇÃO À P ROBABILIDADE E À I NFERÊNCIA E STATÍSTICA."

Apresentações semelhantes


Anúncios Google