A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatísticas Ordinais Ano Lectivo 2005 / 2006 Estatística de Extremos Isabel Fraga Alves CEAUL & DEIO Universidade de Lisboa.

Apresentações semelhantes


Apresentação em tema: "Estatísticas Ordinais Ano Lectivo 2005 / 2006 Estatística de Extremos Isabel Fraga Alves CEAUL & DEIO Universidade de Lisboa."— Transcrição da apresentação:

1

2 Estatísticas Ordinais Ano Lectivo 2005 / 2006 Estatística de Extremos Isabel Fraga Alves CEAUL & DEIO Universidade de Lisboa

3 Ano Lectivo 2005 / 2006 – 2 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Plano O que são Valores Extremos ? Importância de um estudo diferenciado? Áreas de aplicação Modelos de Valores Extremos e Modelo Normal Quantis Teóricos e Quantis Empíricos. Excedências de nível e Períodos de Retorno PPP-plot, PP-plot e QQ-plot: ilustração com alguns ficheiros de dados. Importância do peso da cauda na estimação de Quantis Extremais Dados S&P500 e noção de VaR Abordagens: MMA, POT, MO, Dois Testes de detecção do peso da cauda: Abordagem PORT Ilustração: 3 conjuntos de dados

4 Ano Lectivo 2005 / 2006 – 3 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Katrina : Um desastre (não)natural? Nova Orleães encontra-se situada abaixo do nível do mar, no meio de dois lagos, a norte e a Este, e do rio Mississipi a sul. De acordo com as informações divulgadas pelas autoridades locais, esta inundação deveu-se, sobretudo, a uma brecha de 60 metros num dique junto ao lago Pontchartrain.

5 Ano Lectivo 2005 / 2006 – 4 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves New Orleans After Hurricane Katrina: An Unnatural Disaster? The next thing they need to do is to have a double-tiered dike system. I'll refer to them as dikes instead of levees, because we need Dutch engineers to design these structures, not the Army Corps of Engineers. The first structure should be a concrete damn structure of at least feet high that is built all along the lake and every Canal that connects to the lake. This plan would cost billions, but would guarantee that New Orleans would NEVER face this tragedy again. WE can work with Dutch engineers and get this engineered properly. NewYorkTimes,Sept05

6 Ano Lectivo 2005 / 2006 – 5 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves New Orleans After Hurricane Katrina: An Unnatural Disaster? New Orleans was built on a delta. Engineers surrounded it with dikes for flood protection. Yes, I know about Holland. Holland is not on the Mississippi River. It is not in hurricane alley. It was a matter of time. So is the next disaster, if this lesson isn't learned. Do we really want to do this again in 20 years?

7 Ano Lectivo 2005 / 2006 – 6 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves O que são Valores Extremos? Quando calamidades naturais de grande magnitude acontecem, questionamos acerca da sua ocorrência e frequência Acontecimentos Raros? Poderiam ter sido tomadas providências (do Lat. providentia, acto de ver com antecipação: s. f., suprema sabedoria divina (grafado com inicial maiúscula); Deus; medida, resolução que se toma para evitar um mal ou para corrigir irregularidades; acontecimento feliz; pessoa que protege outrem; prevenção ) de forma a prevenir ou a estarmos melhor preparados para tais calamidades? Secas, Inundações, Terramotos, Furacões ou Ventos Ciclónicos, Tempestades de Precipitação,...

8 Ano Lectivo 2005 / 2006 – 7 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves O que são Valores Extremos? Um engenheiro em Nova Orleães pode querer construir um dique com uma altura tal que só muito raramente vê ameaçada a sua estrutura face a calamidades associadas. Um engenheiro no Japão pode estar interessado em construir um arranha-céus que permaneça intacto perante um terramoto de 100-anos, i.e., que em média ocorre de 100 em 100 anos Um engenheiro pode querer construir uma ponte sobre o Mississipi, fixando a sua altura de forma a que esperemos que a água do rio ultrapasse o nível da ponte muito raramente, digamos uma vez em 200 anos

9 Ano Lectivo 2005 / 2006 – 8 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves O que são Valores Extremos? Os exemplos apresentados são apenas alguns dos muitos que poderíamos enumerar, na área de Fenómenos Naturais É evidente que as características de interesse naqueles casos são extremos no sentido que focamos a nossa atenção para o MÍNIMO ( por ex, SECAS – Mínimo da quantidade de Precipitação ) MÁXIMO ( por ex, INUNDAÇÕES – Máximo do Caudal de um rio )

10 Ano Lectivo 2005 / 2006 – 9 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Porque são importantes os Modelos de Valores Extremos? Em muitas aplicações estatísticas o interesse é dirigido para a estimação de características centrais (ex, o valor médio da precipitação, o valor médio da temperatura) tendo por base amostras aleatórias provenientes da população sob estudo. No entanto, em muitas áreas aplicadas, estamos interessados na ocorrência de acontecimentos raros, ie, de grandes ou pequenos valores. Para os engenheiros, é sabido que os valores utilizados em construção (barragens, edifícios, pontes, etc) são obtidos como um compromisso entre segurança e custo, ie, garantindo a sua sobrevivência quando sujeitos a condições extremas e a um custo razoável.

11 Ano Lectivo 2005 / 2006 – 10 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Porque são importantes os Modelos de Valores Extremos? A estimação na área de valores extremos é difícil, devido à falta de dados disponíveis. O uso de factores ou cargas de segurança tem sido uma solução clássica para o problema, mas actualmente é sabido que esta solução não é completamente satisfatória quer em termos de segurança quer de custo: por um lado, elevadas probabilidades de falha podem vir a ser obtidas; por outro, eventualmente os projectos de construção têm associados gastos elevados desnecessariamente. O conhecimento das distribuições do máximo (e do mínimo) dos fenómenos de interesse é importante na obtenção de boas soluções em problemas de planeamento.

12 Ano Lectivo 2005 / 2006 – 11 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Exemplos de Aplicação Engenharia Marítima alturas de onda para a construção de plataformas, diques, molhes costeiros, quebra-mar, etc. Qual a distribuição da onda máxima? Engenharia Estrutural ventos extremos, em termos de velocidade do vento (ou incidência sísmica), tendo por objectivo a construção de edifícios. Qual a distribuição da velocidade de vento máxima? Meteorologia condições meteorológicas extremas influenciam muitos aspectos da vida do ser humano tais como a agricultura ou vida animal, tempo de vida de certos materiais. Nestes casos, mais uma vez se centra a atenção na ocorrência de valores extremos (temperaturas muito baixas ou muito altas, por ex.) Qual a probabilidade desses acontecimentos raros? E ainda... Resistência de materiais, Fadiga de materiais, Resistência à corrosão, estudos de Poluição, perdas de índices Financeiros, etc... !

13 Ano Lectivo 2005 / 2006 – 12 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelos de Valores Extremos Análise de Valores Extremos Modelos dirigidos para Valores extremos, não valores centrais; modelar a cauda da distribuição de interesse Problema: Como fazer inferência para além da amostra de dados ? Uma Resposta: usar técnicas baseadas na Teoria de Valores Extremos de forma a proceder a inferências estatísticas sobre acontecimentos raros usando apenas uma quantidade limitada de dados! Notação: Máximo da AmostraMínimo da Amostra

14 Ano Lectivo 2005 / 2006 – 13 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Então Teoria Básica - A distribuição do Máximo [GVE- Generalizada de Valores Extremos] Representação de von Mises-Jenkinson Gnedenko (1943)

15 Ano Lectivo 2005 / 2006 – 14 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves As distribuições Valores Extremos (máximos) A GVE engloba os 3 tipos de máximos:[Fisher-Tippett] Fréchet: Weibull: Gumbel: limite para distribuições de cauda pesada limite para distribuições de caudas curtas caudas vão para zero com velocidade exponencial

16 Ano Lectivo 2005 / 2006 – 15 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves GVE( )

17 Ano Lectivo 2005 / 2006 – 16 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Então Teoria Básica - A distribuição do Mínimo m n :=X 1:n [GVE*- de mínimos]

18 Ano Lectivo 2005 / 2006 – 17 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves As distribuições the Valores Extremos (mínimos) A GVE* engloba os 3 tipos de mínimos:[Fisher-Tippett] Fréchet de mínimos: Weibull de mínimos: Gumbel de mínimos:

19 Ano Lectivo 2005 / 2006 – 18 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

20 Ano Lectivo 2005 / 2006 – 19 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

21 Ano Lectivo 2005 / 2006 – 20 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

22 Ano Lectivo 2005 / 2006 – 21 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Normal N ( ) Função de distribuição (f.d.): Φ (x)=P[X x] Med(X) = E [ X ] = m

23 Ano Lectivo 2005 / 2006 – 22 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Normal N ( )

24 Ano Lectivo 2005 / 2006 – 23 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Normal N ( )

25 Ano Lectivo 2005 / 2006 – 24 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Gumbel

26 Ano Lectivo 2005 / 2006 – 25 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelo Gumbel

27 Ano Lectivo 2005 / 2006 – 26 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelos Normal & Gumbel

28 Ano Lectivo 2005 / 2006 – 27 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Modelos Normal & Gumbel

29 Ano Lectivo 2005 / 2006 – 28 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Normal & Gumbel Gráfico das funções densidade relativamente aos modelos Normal e Gumbel, para idênticos valores médio e variância Gráfico das funções densidade relativamente aos modelos Normal(0,1) e Gumbel padrão.

30 Ano Lectivo 2005 / 2006 – 29 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Normal vs. Gumbel de máximos Gráficos da f.d.p. e da f.d. do máximo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes do modelo Normal(0,1) Gráficos da f.d.p. e da f.d. do máximo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes dos modelos Gumbel padrão.

31 Ano Lectivo 2005 / 2006 – 30 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Normal vs. Gumbel de mínimos Gráficos da f.d.p. e da f.d. do mínimo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes do modelo Normal(0,1) f.d.p. e f.d. do mínimo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes dos modelos Gumbel de mínimos padrão.

32 Ano Lectivo 2005 / 2006 – 31 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Função distribuição empírica dados ordenados amostra aleatória. Réplicas de X com f.d. F( x )=P[Xx] ? ? amostra de dados função distribuição empírica (f.d.e.) Modelo ? Qual a f.d. F da população ?

33 Ano Lectivo 2005 / 2006 – 32 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves p-quantis da população e p-quantis empíricos População : X com f.d. F(x) p-quantil de X : dados ordenados p-quantil empírico :

34 Ano Lectivo 2005 / 2006 – 33 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves p-quantis das distribuições de Valores Extremos (máximos) GVE : Fréchet : Weibull : Gumbel :

35 Ano Lectivo 2005 / 2006 – 34 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves p-quantis das distribuições de Valores Extremos (mínimos) GVE* : Fréchet de mínimos: Weibull de mínimos: Gumbel de mínimos:

36 Ano Lectivo 2005 / 2006 – 35 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves p-quantis para Modelos com Localização e Escala Localização = Escala = p-quantil para X

37 Ano Lectivo 2005 / 2006 – 36 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Excedência de nível Excedência:. Seja X uma v.a. e u um dado valor de nível. O acontecimento {X=x} é denominado de excedência do nível u se x> u.

38 Ano Lectivo 2005 / 2006 – 37 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Excedência de nível e modelo Bernoulli Exemplo:. As ondas podem destruir um quebra-mar quando as suas alturas excedam um dado valor, digamos 9m. Então não importa se a altura de uma onda é 9.5, 10, 0u 12m, porque as consequências destes acontecimentos são as mesmas. Seja X uma v.a. da altura das ondas e Y u a v.a. definida por é uma v.a. de Bernoulli com probabilidade de sucesso

39 Ano Lectivo 2005 / 2006 – 38 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Excedência de nível e modelo Bernoulli Exemplo(altura de onda máxima anual): Ao planear um quebra- mar, os engenheiros civis necessitam de definir o nível de altura de onda, o qual corresponde à altura tal que o quebra-mar terá a resistência suficiente para a enfrentar, no caso de ocorrer, sem estragos. Então um planeamento natural para esse valor seria tomar a altura máxima de onda que atinge o quebra-mar durante o seu tempo de vida. Contudo, este valor é aleatório e não pode ser encontrado. Então, a única coisa que um engenheiro pode fazer é escolher este valor de modo a que venha a ser excedido com uma pequena probabilidade. Para obter esta probabilidade (ou o valor) é necessário conhecer a probabilidade de excedência de certos valores ao longo do ano. Se estivermos interessados no acontecimento da altura máxima anual de onda exceder um dado nível h 0, temos uma v.a. Bernoulli.

40 Ano Lectivo 2005 / 2006 – 39 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Período de Retorno e modelo Geométrico Suponha-se que um dado acontecimento A (cheia, excedência de nível,…) é tal que a probabilidade de ocorrência durante um período (1 ano) é um pequeno valor p. Consideremos a sequência de experiências de Bernoulli (A ou A c ) ao longo do tempo. O tempo (em anos) até a primeira ocorrência A é uma v.a. Geométrica X, com E[X]=1/p. Período de retorno: Seja A um acontecimento, e T o tempo aleatório entre sucessivas ocorrências de A. O valor médio de T, E[T] é designado por período de retorno de A. (tempo médio para o retorno desse acontecimento)

41 Ano Lectivo 2005 / 2006 – 40 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Períodos de Retorno Se F é a f.d. do máximo anual X, o período de retorno, T x, do acontecimento A={X> x } (excedência) é T x = 1/P[A] = [1-F( x )] -1 anos. Se F é a f.d. do mínimo anual X*, o período de retorno, T x *, do acontecimento A*={X< x } (shortfallou queda) é T x * = 1/P[A*] = [F( x )] -1 anos.

42 Ano Lectivo 2005 / 2006 – 41 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Período de Retorno de uma cheia Exemplo: Seja F a f.d. do cheia máxima anual (em m 3 /seg) numa dada secção do rio O período de retorno de cheias de 70 m 3 /seg é Quer dizer: uma cheia máxima anual de 70 m 3 /seg ocorre, em média uma vez em anos

43 Ano Lectivo 2005 / 2006 – 42 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Nível de altura de onda Exemplo: Um quebra-mar é desenhado para resistir durante uma vida média útil de 50 anos. Seja F a f.d. da altura máxima anual de onda (em pés) é O nível de altura de onda deverá verificar Quer dizer: nível de altura de onda é h =30.61 pés

44 Ano Lectivo 2005 / 2006 – 43 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Ficheiros de Dados (Castillo, Hadi Balakrishnan & Sarabia 2005) Wind Data velocidade máxima anual do vento, em milhas/hora, registadas num dado local, durante um período de 50 anos (para a construção de edifícios) Flood Data caudal máximo anual de um rio, em metros cúbicos, medido num dado local, durante 60 anos (planeamento de prevenção contra inundações). Wave Data altura de onda máxima anual, em pés, observadas num dado local ao longo de 50 anos (construção de quebra-mar). Epicenter Data a distância, em milhas, de uma dada central nuclear ao epicentro dos 60 terramotos mais recentes, e com grau de intensidade acima de um certo limiar (prevenção do risco associado a sismos próximos da central nuclear). Os geólogos detectaram uma falha a 50Km da central e que será a principal causa dos sismos naquela área. Precipitation Data a precipitaçãp total anual em Filadélfia, nos últimos 40 anos, medida em polegadas, (prevenção contra seca).

45 Ano Lectivo 2005 / 2006 – 44 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Castillo,E., Hadi,A.S., Balakrishnan,N. and Sarabia,J. M., (2005), Extreme Value and Related Models in Engineering and Science Applications, New York: John Wiley & Sons. Data Set NameTable Number Wind1.1 Flood1.2 Wave1.3 Epicenter1.9 Precipitation1.13

46 Ano Lectivo 2005 / 2006 – 45 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Papel de Probabilidades Plot (PPP) Trata-se de um método gráfico de validação preliminar de um modelo F(x;a,b), associado à característica sob estudo, X, com base numa amostra observada. Obtenção de um papel de probabilidades: 1ºpasso: encontrar uma transformação que expresse a equação numa forma linear, ie, através duma recta do tipo

47 Ano Lectivo 2005 / 2006 – 46 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Papel de Probabilidades Plot (PPP) amostra de dados observados: dados ordenados: Definam-se as plotting positions: Obtenção de um papel de probabilidades (cont.): 2ºpasso: marcar a núvem de pontos (plot) Se o Modelo subjacente é F(x;a,b) os pontos dispõe-se aproximadamente ao longo da recta, i.e.,

48 Ano Lectivo 2005 / 2006 – 47 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Papel de Probabilidades Plot (PPP) Exemplo: Gumbel (máximos), com localização,escala obtendo-se a relação linear:

49 Ano Lectivo 2005 / 2006 – 48 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Papel de Probabilidades Plot (PPP) Exemplo: Weibull (máximos), com localização e escala obtendo-se a relação linear:

50 Ano Lectivo 2005 / 2006 – 49 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Transformações para PPP g(p)g(p)h(x)h(x)PPP

51 Ano Lectivo 2005 / 2006 – 50 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: wave heights – Tabela1.3 amostra ordenada dos dados; dimensão : n= Wave Data altura de onda máxima anual, em pés, observadas num dado local ao longo de 50 anos (construção de quebra-mar). Os dados foram obtidos em águas costeiras. O objectivo do estudo é construir um quebra-mar. A altura de onda é, por definição, uma variável aleatória não-negativa, limitada superiormente. Esta suposição é clara para águas costeiras, mas não evidente para o alto mar.

52 Ano Lectivo 2005 / 2006 – 51 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: wave heights – Tabela1.3 plot - PPP

53 Ano Lectivo 2005 / 2006 – 52 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: wave heights – Tabela1.3 Gumbel (máximos), com localização,escala localização ? escala ?

54 Ano Lectivo 2005 / 2006 – 53 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: wave heights – Tabela1.3 Gumbel (máximos) estimada qual a probabilidade da altura de onda máxima anual exceder 40 pés ?

55 Ano Lectivo 2005 / 2006 – 54 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: wave heights – Tabela1.3 Gumbel (máximos) estimada qual o nível de altura de onda para um período de retorno de 50 anos ? Quer dizer: para um período de retorno de 50 anos, nível de altura de onda é h =34.85 pés

56 Ano Lectivo 2005 / 2006 – 55 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Q-Q plot – Tabela1.3 qualidade da Gumbel (máximos) estimada? Quer dizer: a núvem de pontos do Q-Q plot deverá estar sensivelmente ao longo da recta bissectriz do 1º quadrante. versus

57 Ano Lectivo 2005 / 2006 – 56 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves P-P plot – Tabela1.3 qualidade da Gumbel (máximos) estimada? Quer dizer: os pontos do P-P plot deverão estar sensivelmente ao longo da recta bissectriz do 1º quadrante, no quadrado [0,1]x[0,1] versus

58 Ano Lectivo 2005 / 2006 – 57 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: Houmb – Tabela1.6 amostra ordenada dos dados; dimensão : n=24 Houmbs Data altura significativa de onda máxima anual, medidas em Miken-Skomvaer (Noruega) e publicados por Houmb e Overvik (1977). O objectivo do estudo é construir estruturas marítimas

59 Ano Lectivo 2005 / 2006 – 58 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: Houmb – Tabela1.6 plot - PPP Weibull de máximos ??...localização???

60 Ano Lectivo 2005 / 2006 – 59 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: Houmb – Tabela1.6 plot - PPP Weibull de máximos ??...localização???

61 Ano Lectivo 2005 / 2006 – 60 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: Houmb – Tabela1.6 plot - PPP Weibull de máximos ??...localização???

62 Ano Lectivo 2005 / 2006 – 61 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados: Houmb – Tabela1.6 plot - PPP Weibull de máximos !...localização??? Prossiga-se com a estimação da escala e formapara:... localização para a Weibull estimada Q-Q plots... P-P plots...

63 Ano Lectivo 2005 / 2006 – 62 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Quantis extremos: Normal ou Gumbel?? Modelo ?

64 Ano Lectivo 2005 / 2006 – 63 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Quantis extremos: Normal ou Gumbel?? Modelo ?

65 Ano Lectivo 2005 / 2006 – 64 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Quantis extremos: Normal ou Gumbel?? Modelo ? amostra gerada do modelo Gumbel !

66 Ano Lectivo 2005 / 2006 – 65 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Caudas Pesadas ou Leves ? Fazemos frequentemente uma distinção (mesmo que instintiva!...) entre distribuições bem-comportadas e distribuições perigosas com cauda pesada A classe das distribuições bem-comportadas consiste naquelas distribuições com cauda limitada exponencialmente, grandes observações não são impossíveis, mas a probabilidade de ocorrência decresce a uma velocidade exponencial para zero, à medida que o nível de patamar se torna cada vez maior. caudas leves. Por outro lado, uma das principais preocupações é a detecção de distribuições consideradas perigosas distribuições de cauda pesada não existe um limite exponencial, sendo mais provável que se obtenham grandes observações. As grandes observações exercem forte influência na soma total das observações.

67 Ano Lectivo 2005 / 2006 – 66 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Caudas Pesadas, Índice de Cauda e Momentos Caudas pesadas Variância finita Variância infinita, valor médio finito valor médio infinito

68 Ano Lectivo 2005 / 2006 – 67 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Standard&Poors 500 (S&P500) Valores de fecho da S&P500 de: Janeiro80 até sexta-feira, 16 Outubro87 S&P Outubro87(2ªfeira negra) – fim de Fevereiro88

69 Ano Lectivo 2005 / 2006 – 68 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Dados – log-retornos diários S&P500 Amostra: Janeiro60 até sexta-feira, 16 Outubro87 (dimensão = 6985)

70 Ano Lectivo 2005 / 2006 – 69 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves S&P500: Valores relevantes a partir de Janeiro de 1960? Sub-Amostra de topo: os 3312 valores positivos de

71 Ano Lectivo 2005 / 2006 – 70 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Distribuições de cauda pesada no mercado financeiro Os log-retornos exibem frequentemente caudas pesadas Estamos interessados num certo nível elevado, o qual será excedido com uma pequena probabilidade quantil extremal VaR ( Value-at-Risk) Exemplo: 16 Outubro 1987 – Um gestor de risco quer saber o risco associado ao investimento estimar a % de queda diária do índice S&P500 que ocorra só uma vez em 40 anos dias 40 x 250dias úteis

72 Ano Lectivo 2005 / 2006 – 71 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Problema a tratar: Os log-retornos exibem caudas pesadas? Estamos interessados em estimar x p de F tal que: AMOSTRA Estimação de para caudas pesadas? (parâmetro de 1ª ordem ) A tratar previamente: Ajustamento de modelos extremais, etc... ???

73 Ano Lectivo 2005 / 2006 – 72 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Ajustamento da GVE aos Máximos Anuais - MMA Bloco 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5 Inclusão de parâmetros de localização e escala na GVE índice de cauda (forma)

74 Ano Lectivo 2005 / 2006 – 73 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves A distribuição Generalizada de Pareto (GP) A GP engloba os modelos: Pareto: Cauda pesada Exponencial: Cauda leve Beta: Suporte limitado

75 Ano Lectivo 2005 / 2006 – 74 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Excessos acima de um nível elevado - POT u Balkema-de Haan74+Pickands75Balkema-de Haan74Pickands75

76 Ano Lectivo 2005 / 2006 – 75 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Abordagem semi-paramétrica Maiores Observações (MO) e.o. intermédia superior

77 Ano Lectivo 2005 / 2006 – 76 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Testes de detecção do peso da cauda O parâmetro de forma determina o peso da cauda Escolha entre Domínios de Atracção ou

78 Ano Lectivo 2005 / 2006 – 77 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Peaks Over Random Threshold - PORT Excessos Acima do Nível Aleatório

79 Ano Lectivo 2005 / 2006 – 78 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Maiores Observações Excessos acima do Nível Aleatório Abordagem r-Momento dos Excessos

80 Ano Lectivo 2005 / 2006 – 79 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Razão entre o Máximo e a Média dos Excessos - NPFA Motivação: comportamento diferenciado da razão entre o máximo e a média para caudas leves e pesadas Não depende da localização nem da escala (Neves&Picek&FAlves.(2006))

81 Ano Lectivo 2005 / 2006 – 80 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Estatística de Hasofer e Wang - HW Motivação: tem por base a estatística de ajustamento de Shapiro-Wilk 65 Não depende da localização nem da escala (Hasofer & Wang 92)

82 Ano Lectivo 2005 / 2006 – 81 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Estatística de tipo Greenwood - Gt Motivação: tem por base a estatística de Greenwood 46 Não depende da localização nem da escala

83 Ano Lectivo 2005 / 2006 – 82 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Relação entre HW e Gt Reescreva-se HW sob a égide de Gt, (Neves and Fraga Alves, ´06)Neves and Fraga Alves, ´06)

84 Ano Lectivo 2005 / 2006 – 83 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Testes de nível assintótico - quantil da Normal Rejeitar H 0 (caudas leves) em favor de H 1 (bilateral) se: Rejeitar H 0 (caudas leves) em favor de H 1 (caudas pesadas) se: Rejeitar H 0 (caudas leves) em favor de H 1 (caudas curtas) se: sob H 0 : As estatísticas de Teste normalizadas são assintoticamente normais para sequências intermédias:

85 Ano Lectivo 2005 / 2006 – 84 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Rejeitar H0 (caudas leves) em favor de H1 (bilateral) se: Rejeitar H0 (caudas leves) em favor de H1 (caudas curtas) se: Gumbel quantile Rejeitar H0 (caudas leves) em favor de H1 (caudas pesadas) se: Testes de nível assintótico sob H 0 : A estatística de Teste normalizada é assintoticamente Gumbel para sequências intermédias:

86 Ano Lectivo 2005 / 2006 – 85 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves DADOS Bilbao – 179 observações zero-crossing médias horárias (em segs) das ondas do mar, medidas na bóia de Bilbao em Janeiro de 1997, tendo sido retidos apenas os valores superiores a 7 segs. (influência dos períodos na morfodinâmica da praia relacionados com a cauda direita da distribuição subjacente) Ozono – 731 observações níveis de ozono (em partes por billião) registados por hora em Harris County durante S&P500 – 6985 observações série de valores de fecho do índice financeiro S&P500 (log-retornos), de Janeiro1960 até à sexta feira, 16 Outubro 1987 (dia anterior ao crash da 2ª feira Negra, 16 Outubro 1987).

87 Ano Lectivo 2005 / 2006 – 86 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves g 0.05 Bilbao waves data Amostra : (dimensão = 179)

88 Ano Lectivo 2005 / 2006 – 87 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Ozone data Amostra : (dimensão = 731)

89 Ano Lectivo 2005 / 2006 – 88 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves S&P500 Amostra: (dimensão = 6985)

90 Ano Lectivo 2005 / 2006 – 89 Curso Pós-graduado de Especialização em Probabilidades e Estatística, Isabel Fraga Alves Algumas Referências Balkema, A., and de Haan, L.(1974). Residual lifetime at great age. Ann.Probab.2, Beirlant, J., Goegebeur, Y., Segers, J. and Teugels, J.(2004). Statistics of Extremes: Theory and Applications. John Wiley & Sons. Castillo, E., Hadi, A. S., Balakrishnan, N. and Sarabia, J. M., (2005). Extreme Value and Related Models in Engineering and Science Applications, New York: John Wiley & Sons. Embrechts,P., Kluppelberg,C. e Mikosch, T. (1997). Modelling Extremal Events. Springer-Verlag. Gnedenko, B.V., (1943). Sur la distribution limite du terme maximum dune série aléatoire. Ann.Math.44, Greenwood, M. (1946). The statistical study of infectious diseases. J. Royal Stat. Soc., Ser. A, 109, de Haan, L. (1984). Slow variation and characterization of domains of attraction. In: Statistical Extremes and Applications (J. Tiago de Oliveira, ed.), Reidel Publishing, Dordrecht. de Haan, L. (2006). On Extreme Value Theory. Or: How to Learn from Almost Disastrous Events. Gulbenkian Lecture presented on the 22nd February Edições CEAUL. Hasofer, A.M. e Wang, Z. (1992). A test for extreme value domain of attraction. JASA, Vol. 87, Neves, C., Picek, J. and Fraga Alves, M.I.(2006). Contribution of the maximum to the sum of excesses for testing max-domains of attraction. JSPI, 136, 4, Neves, C. and Fraga Alves, M.I.(2006). Semi-parametric Approach to Hasofer-Wang and Greenwood Statistics in Extremes. To appear in TEST. Pickands III, J.(1975). Statistical Inference using extreme order statistics. Ann.Statist.3, Reiss, R.-D. and Thomas, M. (2001). Statistical Analysis of Extreme Values, with Applications to Insurance, Finance,Hydrology and Other Fields. 2nd ed. Birkhauser. Verlag.


Carregar ppt "Estatísticas Ordinais Ano Lectivo 2005 / 2006 Estatística de Extremos Isabel Fraga Alves CEAUL & DEIO Universidade de Lisboa."

Apresentações semelhantes


Anúncios Google