A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Aula 0. Doces Lembranças de MAE0219. População Características Informações contidas nos dados Conclusões sobre as características da população Técnicas.

Apresentações semelhantes


Apresentação em tema: "Aula 0. Doces Lembranças de MAE0219. População Características Informações contidas nos dados Conclusões sobre as características da população Técnicas."— Transcrição da apresentação:

1 Aula 0. Doces Lembranças de MAE0219

2 População Características Informações contidas nos dados Conclusões sobre as características da população Técnicas de amostragem Análise descritiva Inferência estatísticaEstatística

3 População Características Técnicas de amostragem

4 Análise descritiva Informações contidas nos dados Análise descritiva = resumo de dados

5 QUALITATIVA QUANTITATIVAQUANTITATIVA NOMINAL ORDINAL CONTÍNUA DISCRETA peso, altura, salário, idade número de filhos, número de carros sexo, cor dos olhos classe social, grau de instrução qualquer característica associada a uma população chamamos de variável aleatória classificação de variáveis aleatórias

6 Resumo de variáveis quantitativas 6 Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação. MEDIDAS DE DISPERSÃO Mínimo, Máximo, Moda, Média, Mediana, Percentis. MEDIDAS DE POSIÇÃO

7 Medidas de Posição 7 Máximo (max):Máximo (max): a maior observação. Mínimo (min):Mínimo (min): a menor observação. Moda (mo):Moda (mo): é o valor (ou atributo) que ocorre com maior frequência. Dados: Dados: 4, 5, 4, 6, 5, 8, 4 mo = 4 max = 8 min = 4

8 8 MédiaMédia Dados: Dados: 2, 5, 3, 7, 8

9 MedianaMediana dados ordenados A mediana é o valor da variável que ocupa a posição central de um conjunto de n dados ordenados. 2 Posição da mediana Posição da mediana : n+1

10 10 Exemplos Dados: Dados: 2, 6, 3, 7, 8 Dados ordenados: n = 5 (ímpar) n = 5 (ímpar) Posição da Mediana 5+1 = 3 2 Md = (4 + 6) / 2 = 5 Dados: Dados: 4, 8, 2, 1, 9, 6 n = 6 (par) n = 6 (par) Dados ordenados: Md 6+1 = 3,5 2 Md = 6

11 p 100p n pn O percentil de ordem p 100 (0 < p < 1), em um conjunto de dados de tamanho n, é o valor da variável que ocupa a posição p (n + 1) do conjunto de dados ordenados. 11 Percentis Percentis percentil 50 = mediana ou segundo quartil (Md); percentil 25 = primeiro quartil (Q 1 ); percentil 75 = terceiro quartil (Q 3 ); percentil 10 = primeiro decil. Casos particulares

12 12 Md = 3,05 Q 1 = 2,05 Q 3 = 4,9 Md = 5,3 Q1 = 1,7 Q3 = 12,9 Dados: Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 n=10 n=10 Posição de Md: 0,5(n+1)= 0,5 11= 5,5 Dados: Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 n=11 n=11 Posição de Q1: 0,25 (11) = 2,75 Posição de Q3: 0,75 (11) = 8,25 Md = (3 + 3,1)/2 = 3,05 Q 1 =( 2+2,1)/2=2,05 Q 3 =(3,7+6,1)/2=4,9

13 13 Medidas de Dispersão Finalidade: Finalidade: encontrar um valor que resuma a variabilidade de um conjunto de dados. AmplitudeAmplitude Para os grupos anteriores, temos: Grupo 1, A = 4 Grupo 2, A = 8 Grupo 3, A = 0 A = max - min

14 14 Dados : Dados : 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Q1 = 2,05 e Q3= 4,9 Q3 - Q1 = 4,9 - 2,05 = 2,85 Intervalo-InterquartilIntervalo-Interquartil Q3 - Q1. É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1.

15 VariânciaVariância Desvio padrãoDesvio padrão

16 16 - é uma medida de dispersão relativa; - elimina o efeito da magnitude dos dados; - exprime a variabilidade em relação à média. Coeficiente de Variação Coeficiente de Variação

17 17 Máximo Q3 Mediana Q1 Mínimo 25% 50% 75% Boxplot LS=Q3+1,5(Q3-Q1) LI=Q1-1,5(Q3-Q1) Máximo é o maior valor menor que LS; Mínimo é o menor valor maior que LI.

18 18 Histograma Bases iguais Construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à frequência da classe (f).altura proporcional à frequência da classe (f). Agrupar os dados em intervalos de classes (distribuição de frequências) Bases diferentes Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a frequência relativa da classe(fr). A altura será dada porárea do retângulo igual a frequência relativa da classe(fr). h = fr/base (densidade de frequência).

19 19 PULSEHistograma da altura Arquivo PULSE – Histograma da altura (Height) Classe de altura f fr 60,25 61,75 61,75 63,25 63,25 64,75 64,75 66,25 66,25 67,75 67,75 69,25 69,25 70,75 70,75 72,25 72,25 73,75 73,75 75,25 Total ,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 > b<-seq(60.25,75.25,by=1.50) >hist(dados$Height,breaks=b,main=NULL,xlab="Height")

20 Exemplo Exemplo : Classes desiguais f Classes (meses) f fr h 0 | ,28 0,093 3 | ,20 0, | ,16 0, | ,36 0,010 Total 500 1,00 Distribuição das idades (em meses) de uma amostra de 500 crianças vacinadas h 0,10 0,02 0,04 0,06 0,08 20

21 Distribuição de variável aleatória discreta. Variável aleatória discreta e a sua distribuição podem ser definidas pela sua tabela...

22 / Distribuição de variável aleatória discreta.

23 Distribuição de variável aleatória discreta.

24 Distribuição de variável aleatória discreta.

25 Distribuição Bernoulli. 01 Caso quero a distribuição de incremento do preço posso considerar 1 Distribuição de variável aleatória discreta.

26 ... Distribuição de variável aleatória discreta.

27 Variância: Variância: É o valor esperado da v.a. ( X – E(X )) 2, ou seja, se X assume os valores x 1, x 2,..., x n, então Da relação acima, segue que Desvio Padrão : Desvio Padrão : É definido como a raiz quadrada positiva da variância, isto é, Notação: Var ( X ). σ2σ2 Notação: DP ( X ). σ

28 Distribuição de variável aleatória discreta. Propriedades Esperança e Variância.

29 Sua função de probabilidade é dada por Notação: X ~ B ( n ; p ). n.n.,... 1, 0, k, k - n p)p) - (1 k p k n k)k) P ( X Distribuição binomial : X número de sucessos em n ensaios de Bernoulli independentes e com mesma probabilidade p de sucesso A v.a. X correspondente ao número de sucessos em n ensaios de Bernoulli independentes e com mesma probabilidade p de sucesso tem distribuição binomial com parâmetros n e p.

30 Resultado : média : = E ( X ) = np variância : 2 = Var ( X ) = np (1- p )= npq Se X ~ B ( n ; p ), então

31

32

33

34

35

36

37

38

39

40

41

42

43 Considere a binomial com n = 50 e p = 0,2, representada pelo histograma P ( Y = 13) é igual a área do retângulo de base unitária e altura igual a P ( Y = 13); similarmente, P ( Y = 14), etc... Logo, P ( Y 13) é igual à soma das áreas dos retângulos correspondentes. A idéia é aproximar tal área pela área sob uma curva normal, à direita de 13. Aproximação da binomial pela normal Qual curva normal? Qual curva normal?

44 44 com Y ~ N ( np ; np (1 – p ) ). Portanto, P ( a X b ) P ( a Y b ) P ( X a ) P ( Y a ) P ( X b ) P ( Y b ) X ~ b ( n ; p ) E ( X ) = np Var ( X ) = np (1 – p ) Y ~ N ( y ; y 2 ) com y = np e y 2 = np (1 – p ). Parece razoável considerar a normal com média e variância iguais às da binomial, ou seja, aproximamos a distribuição de probabilidades de X pela distribuição de probabilidades de uma variável aleatória Y, sendo

45 45 aproximada O cálculo da probabilidade aproximada é feito da forma usual para a distribuição normal: P ( a X b ) P ( a Y b ) com Y ~ N ( np ; np (1 – p )). Lembrando que então.

46 46 Observações : 1 - A aproximação da distribuição binomial pela normal é boa quando np (1- p ) A demonstração da validade desta aproximação é feita utilizando-se o Teorema Central do Limite ( TCL ).

47

48

49

50


Carregar ppt "Aula 0. Doces Lembranças de MAE0219. População Características Informações contidas nos dados Conclusões sobre as características da população Técnicas."

Apresentações semelhantes


Anúncios Google