Estatística de Extremos

Slides:



Advertisements
Apresentações semelhantes
«Forte do Bom Sucesso (Lisboa) – Lápides 1, 2, 3» «nomes gravados, 21 de Agosto de 2008» «Ultramar.TerraWeb»
Advertisements

Estimação de parâmetros
Introdução ao processamento de dados e à estatística - parte 02
Algoritmos para Geração de Variáveis Aleatórias
UNICAMP Universidade Estadual de Campinas Centro Superior de Educação Tecnológica Divisão de Telecomunicações Propagação de Ondas e Antenas Prof.Dr. Leonardo.
DISTRIBUIÇÃO NORMAL. O histograma por densidade é o seguinte: Exemplo : Observamos o peso, em kg, de 1500 pessoas adultas selecionadas ao acaso em uma.
INFORMAÇÕES COMPLEMENTARES
EXERCÍCIOS RESULTADO.
A busca das mulheres para alcançar seu espaço dentro das organizações
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Vamos contar D U De 10 até 69 Professor Vaz Nunes 1999 (Ovar-Portugal). Nenhuns direitos reservados, excepto para fins comerciais. Por favor, não coloque.
Capa Disciplina: Ajustamento de Observações
Exercício do Tangram Tangram é um quebra-cabeças chinês no qual, usando 7 peças deve-se construir formas geométricas.
Nome : Resolve estas operações começando no centro de cada espiral. Nos rectângulos põe o resultado de cada operação. Comprova se no final.
Sumário, aula 9 Elasticidade Elasticidade arco Elasticidade no ponto
Cálculo - Thomas Capítulo 3.
Curso de ADMINISTRAÇÃO
Análise de regressão linear simples: abordagem matricial
EXPRESSÕES ARITMÉTICAS
FUNÇÃO MODULAR.
Aula 4 Nomes, Vinculações, Tipos e Escopos
Avaliando Títulos de Dívida
Estatística Aplicada (Aula 4)
Estatística Aplicada (Aula 4)
Mecânica dos Sólidos não Linear
ESTATÍSTICA.
Renda até 2 SM.
Indicadores do Mercado de Meios Eletrônicos de Pagamento
Diagnósticos Educativos = Diagnósticos Preenchidos 100% = 1.539
ESTATÍSTICA.
PESQUISA SOBRE PRAZO MÉDIO DA ASSISTÊNCIA NA SAÚDE SUPLEMENTAR
Aproximação da binomial pela normal
ME623 Planejamento e Pesquisa
Monitoria de Probabilidade e Estatística
CATÁLOGO GÉIA PÁG. 1 GÉIA PÁG. 2 HESTIA PÁG. 3.
PROCESSOS PRINCIPAIS Alunos - Grau de Satisfação 4971 avaliações * Questões que entraram em vigor em 2011 ** N.A. = Não Aplicável Versão: 07/02/2012 INDICADORES.
Trabalho sobre Cor Thiago Marques Toledo.
Indicadores do Mercado de Meios Eletrônicos de Pagamento Setembro de 2006.
Indicadores do Mercado
1 Indicadores do Mercado de Meios Eletrônicos de Pagamento Junho de 2006 Indicadores do Mercado de Meios Eletrônicos de Pagamento Junho de 2006.
Exponential Random Graph Models
JESUS SE ENCONTRA COM SEUS PRIMEIROS SEGUIDORES
Distribuição de Probabilidades
FISCALIZAÇÃO DIRECIONADA CONDUTA - AUXILIAR ANO III – Nº 05.
Coordenação Geral de Ensino da Faculdade
Medidas de posição  Estudando as distribuições de  frequência,  percebe-se que existe uma  posição de  concentração dos valores, que podem estar mais concentrados no início, no meio ou no 
Os números a seguir, representam as notas de
Medidas de Dispersão ou de Variabilidade:
Funcionários - Grau de Satisfação 2096 avaliações
PERFIL DOS BENEFICIÁRIOS E NÃO-BENEFICIÁRIOS DO PROGRAMA BOLSA FAMÍLIA EM TERMOS DE MERCADO DE TRABALHO: CONSIDERAÇÕES METODOLÓGICAS E SUBSTANTIVAS Alessandra.
Tributação da Exportação nas Empresas optantes pelo Simples Nacional
Projeto Marcas que Eu Gosto 1 PROJETO MARCAS QUE EU GOSTO Estudos Quantitativo de Consumidores Janeiro / 2005.
Erros e variáveis aleatórias
Modelagem Estatística
Núcleo de Mídia – Comercial Ranking Nacional de Circulação - Domingos Evolução Mês* 3,38% 2,20% 1,39% 1,13% -4,84% 0,49% -6,16% -0,07% -0,71% 0,27% 0,43%
1/40 COMANDO DA 11ª REGIÃO MILITAR PALESTRA AOS MILITARES DA RESERVA, REFORMADOS E PENSIONISTAS - Mar 06 -
ESTATÍSTICA.
CLASSIFICAÇÃO DE FILMES
APOIOS PEDAGÓGICO ACRESCIDO
Amostragem Pontos mais importantes:
Projeto Medindo minha escola.
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
1 Aplicações do Fecho Regular. 2 A interseção de uma linguagem livre de contexto e uma linguagem regular é uma linguagem livre de contexto livre de contexto.
Determinação de Vazões Extremas
CONCEITOS FUNDAMENTAIS
Olhe fixamente para a Bruxa Nariguda
3ª PESQUISA DE REMUNERAÇÃO
Equipe Bárbara Régis Lissa Lourenço Lucas Hakim Ricardo Spada Coordenador: Gabriel Pascutti.
Medidas de tendência central e de dispersão
Lição nº52 e /11/2013 Sumário: Tratamento de Dados: frequências, mediana,gráficos e dados agrupados em classes.
Transcrição da apresentação:

Estatística de Extremos Isabel Fraga Alves CEAUL & DEIO Universidade de Lisboa

Plano O que são Valores Extremos ? Importância de um estudo diferenciado? Áreas de aplicação Modelos de Valores Extremos e Modelo Normal Quantis Teóricos e Quantis Empíricos. Excedências de nível e Períodos de Retorno PPP-plot, PP-plot e QQ-plot: ilustração com alguns ficheiros de dados. Importância do peso da cauda na estimação de Quantis Extremais Dados S&P500 e noção de VaR Abordagens: MMA, POT, MO, Dois Testes de detecção do peso da cauda: Abordagem PORT Ilustração: 3 conjuntos de dados

Katrina : Um desastre (não)natural? Nova Orleães encontra-se situada abaixo do nível do mar, no meio de dois lagos, a norte e a Este, e do rio Mississipi a sul. De acordo com as informações divulgadas pelas autoridades locais, esta inundação deveu-se, sobretudo, a uma brecha de 60 metros num dique junto ao lago Pontchartrain.

New Orleans After Hurricane Katrina: An Unnatural Disaster? NewYorkTimes,Sept’05 The next thing they need to do is to have a double-tiered dike system. I'll refer to them as dikes instead of levees, because we need Dutch engineers to design these structures, not the Army Corps of Engineers. The first structure should be a concrete damn structure of at least 40-50 feet high that is built all along the lake and every Canal that connects to the lake. This plan would cost billions, but would guarantee that New Orleans would NEVER face this tragedy again. WE can work with Dutch engineers and get this engineered properly.

New Orleans After Hurricane Katrina: An Unnatural Disaster? New Orleans was built on a delta. Engineers surrounded it with dikes for flood protection. Yes, I know about Holland. Holland is not on the Mississippi River. It is not in hurricane alley. It was a matter of time. So is the next disaster, if this lesson isn't learned. Do we really want to do this again in 20 years?

O que são Valores Extremos? Quando calamidades naturais de grande magnitude acontecem, questionamos acerca da sua ocorrência e frequência → Acontecimentos Raros? Poderiam ter sido tomadas providências (do Lat. providentia, acto de ver com antecipação: s. f., suprema sabedoria divina (grafado com inicial maiúscula); Deus; medida, resolução que se toma para evitar um mal ou para corrigir irregularidades; acontecimento feliz; pessoa que protege outrem; prevenção) de forma a prevenir ou a estarmos melhor preparados para tais calamidades? Secas, Inundações, Terramotos, Furacões ou Ventos Ciclónicos, Tempestades de Precipitação, ...

O que são Valores Extremos? Um engenheiro em Nova Orleães pode querer construir um dique com uma altura tal que só “muito raramente” vê ameaçada a sua estrutura face a calamidades associadas. Um engenheiro no Japão pode estar interessado em construir um arranha-céus que permaneça intacto perante um “terramoto de 100-anos”, i.e., que em média “ocorre de 100 em 100 anos” Um engenheiro pode querer construir uma ponte sobre o Mississipi, fixando a sua altura de forma a que esperemos que a água do rio ultrapasse o nível da ponte “muito raramente”, digamos “uma vez em 200 anos”

O que são Valores Extremos? Os exemplos apresentados são apenas alguns dos muitos que poderíamos enumerar, na área de → Fenómenos Naturais É evidente que as características de interesse naqueles casos são extremos no sentido que focamos a nossa atenção para o MÍNIMO ( por ex, SECAS – Mínimo da quantidade de Precipitação ) MÁXIMO ( por ex, INUNDAÇÕES – Máximo do Caudal de um rio )

Porque são importantes os Modelos de Valores Extremos? Em muitas aplicações estatísticas o interesse é dirigido para a estimação de características centrais (ex, o valor médio da precipitação, o valor médio da temperatura) tendo por base amostras aleatórias provenientes da população sob estudo. No entanto, em muitas áreas aplicadas, estamos interessados na ocorrência de acontecimentos raros, ie, de grandes ou pequenos valores. Para os engenheiros, é sabido que os valores utilizados em construção (barragens, edifícios, pontes, etc) são obtidos como um compromisso entre segurança e custo, ie, garantindo a sua “sobrevivência” quando sujeitos a condições extremas e a um “custo” razoável.

Porque são importantes os Modelos de Valores Extremos? A estimação na área de valores extremos é difícil, devido à falta de dados disponíveis. O uso de factores ou cargas de segurança tem sido uma solução clássica para o problema, mas actualmente é sabido que esta solução não é completamente satisfatória quer em termos de segurança quer de custo: por um lado, elevadas probabilidades de falha podem vir a ser obtidas; por outro, eventualmente os projectos de construção têm associados gastos elevados desnecessariamente. O conhecimento das distribuições do máximo (e do mínimo) dos fenómenos de interesse é importante na obtenção de boas soluções em problemas de planeamento.

Exemplos de Aplicação Engenharia Marítima → alturas de onda para a construção de plataformas, diques, molhes costeiros, quebra-mar, etc. Qual a distribuição da onda máxima? Engenharia Estrutural → ventos extremos, em termos de velocidade do vento (ou incidência sísmica), tendo por objectivo a construção de edifícios. Qual a distribuição da velocidade de vento máxima? Meteorologia → condições meteorológicas extremas influenciam muitos aspectos da vida do ser humano tais como a agricultura ou vida animal, tempo de vida de certos materiais. Nestes casos, mais uma vez se centra a atenção na ocorrência de valores extremos (temperaturas muito baixas ou muito altas, por ex.) Qual a probabilidade desses acontecimentos raros? E ainda ... Resistência de materiais, Fadiga de materiais, Resistência à corrosão, estudos de Poluição, perdas de índices Financeiros, etc... !

Modelos de Valores Extremos Análise de Valores Extremos Modelos dirigidos para Valores extremos, não valores centrais; modelar a cauda da distribuição de interesse Problema: Como fazer inferência para além da amostra de dados ? Uma Resposta: usar técnicas baseadas na Teoria de Valores Extremos de forma a proceder a inferências estatísticas sobre acontecimentos raros usando apenas uma quantidade limitada de dados! Notação: Mínimo da Amostra Máximo da Amostra

Teoria Básica - A distribuição do Máximo Gnedenko (1943) Então [GVE- Generalizada de Valores Extremos] Representação de von Mises-Jenkinson

As distribuições Valores Extremos (máximos) A GVE engloba os 3 tipos de máximos:[Fisher-Tippett] Fréchet: limite para distribuições de cauda pesada Weibull: limite para distribuições de caudas curtas Gumbel: caudas vão para zero com velocidade exponencial

GVE(g)

Teoria Básica - A distribuição do Mínimo mn:=X1:n Então [GVE*- de mínimos]

As distribuições the Valores Extremos (mínimos) A GVE* engloba os 3 tipos de mínimos:[Fisher-Tippett] Fréchet de mínimos: Weibull de mínimos: Gumbel de mínimos:

Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

Modelo Probabilístico contínuo Função de distribuição (f.d.): F(y)=P[Y y] Med(Y) := Mediana de Y

Modelo Normal N(m,s) Função de distribuição (f.d.): Φ(x)=P[X x] Med(X) = E [ X ] = m

Modelo Normal N(m,s)

Modelo Normal N(m,s)

Modelo Gumbel

Modelo Gumbel

Modelos Normal & Gumbel

Modelos Normal & Gumbel

Normal & Gumbel Gráfico das funções densidade relativamente aos modelos Normal e Gumbel, para idênticos valores médio e variância Gráfico das funções densidade relativamente aos modelos Normal(0,1) e Gumbel padrão.

Normal vs. Gumbel de máximos Gráficos da f.d.p. e da f.d. do máximo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes do modelo Normal(0,1) Gráficos da f.d.p. e da f.d. do máximo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes dos modelos Gumbel padrão.

Normal vs. Gumbel de mínimos Gráficos da f.d.p. e da f.d. do mínimo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes do modelo Normal(0,1) f.d.p. e f.d. do mínimo de amostras de dimensão n=1,2,10,100,1000,10000 provenientes dos modelos Gumbel de mínimos padrão.

Função distribuição empírica amostra aleatória. Réplicas de X com f.d. F(x)=P[Xx] ? ? amostra de dados Modelo ? Qual a f.d. F da população? dados ordenados função distribuição empírica (f.d.e.)

p-quantis da população e p-quantis empíricos População : X com f.d. F(x) p-quantil de X : dados ordenados p-quantil empírico :

p-quantis das distribuições de Valores Extremos (máximos) GVE : Fréchet : Weibull : Gumbel :

p-quantis das distribuições de Valores Extremos (mínimos) GVE* : Fréchet de mínimos: Weibull de mínimos: Gumbel de mínimos:

p-quantis para Modelos com Localização e Escala Localização = l Escala = d >0 p-quantil para X

Excedência de nível Excedência:. Seja X uma v.a. e u um dado valor de nível. O acontecimento {X=x} é denominado de excedência do nível u se x> u.

Excedência de nível e modelo Bernoulli Exemplo:. As ondas podem destruir um quebra-mar quando as suas alturas excedam um dado valor, digamos 9m. Então não importa se a altura de uma onda é 9.5, 10, 0u 12m , porque as consequências destes acontecimentos são as mesmas. Seja X uma v.a. da altura das ondas e Yu a v.a. definida por é uma v.a. de Bernoulli com probabilidade de sucesso

Excedência de nível e modelo Bernoulli Exemplo(altura de onda máxima anual): Ao planear um quebra-mar, os engenheiros civis necessitam de definir o nível de altura de onda, o qual corresponde à altura tal que o quebra-mar terá a resistência suficiente para a enfrentar, no caso de ocorrer, sem estragos. Então um planeamento natural para esse valor seria tomar a altura máxima de onda que atinge o quebra-mar durante o seu tempo de vida. Contudo, este valor é aleatório e não pode ser encontrado. Então, a única coisa que um engenheiro pode fazer é escolher este valor de modo a que venha a ser excedido com uma pequena probabilidade. Para obter esta probabilidade (ou o valor) é necessário conhecer a probabilidade de excedência de certos valores ao longo do ano. Se estivermos interessados no acontecimento da altura máxima anual de onda exceder um dado nível h0, temos uma v.a. Bernoulli.

Período de Retorno e modelo Geométrico Suponha-se que um dado acontecimento A (cheia, excedência de nível,…) é tal que a probabilidade de ocorrência durante um período (1 ano) é um pequeno valor p. Consideremos a sequência de experiências de Bernoulli (A ou Ac) ao longo do tempo. O tempo (em anos) até a primeira ocorrência A é uma v.a. Geométrica X , com E[X]=1/p. Período de retorno: Seja A um acontecimento, e T o tempo aleatório entre sucessivas ocorrências de A. O valor médio de T, E[T] é designado por período de retorno de A. (tempo médio para o retorno desse acontecimento)

Períodos de Retorno Se F é a f.d. do máximo anual X, o período de retorno, Tx, do acontecimento A={X>x} (excedência) é Tx = 1/P[A] = [1-F(x)]-1 anos . Se F é a f.d. do mínimo anual X*, o período de retorno, Tx*, do acontecimento A*={X<x} (“shortfall”ou queda) é Tx* = 1/P[A*] = [F(x)]-1 anos .

Período de Retorno de uma cheia Exemplo: Seja F a f.d. do cheia máxima anual (em m3/seg) numa dada secção do rio O período de retorno de cheias de 70 m3/seg é Quer dizer: uma cheia máxima anual de 70 m3/seg ocorre, em média uma vez em 57.24 anos

Nível de altura de onda Exemplo: Um quebra-mar é desenhado para resistir durante uma vida média útil de 50 anos. Seja F a f.d. da altura máxima anual de onda (em pés) é O nível de altura de onda deverá verificar Quer dizer: nível de altura de onda é h =30.61 pés

Ficheiros de Dados (Castillo, Hadi Balakrishnan & Sarabia 2005) Wind Data → velocidade máxima anual do vento, em milhas/hora, registadas num dado local, durante um período de 50 anos (para a construção de edifícios) Flood Data → caudal máximo anual de um rio, em metros cúbicos, medido num dado local, durante 60 anos (planeamento de prevenção contra inundações). Wave Data → altura de onda máxima anual, em pés, observadas num dado local ao longo de 50 anos (construção de quebra-mar). Epicenter Data → a distância, em milhas, de uma dada central nuclear ao epicentro dos 60 terramotos mais recentes, e com grau de intensidade acima de um certo limiar (prevenção do risco associado a sismos próximos da central nuclear). Os geólogos detectaram uma falha a 50Km da central e que será a principal causa dos sismos naquela área. Precipitation Data → a precipitaçãp total anual em Filadélfia, nos últimos 40 anos, medida em polegadas, (prevenção contra seca).

Castillo,E. , Hadi,A. S. , Balakrishnan,N. and Sarabia,J. M Castillo,E., Hadi,A.S., Balakrishnan,N. and Sarabia,J. M., (2005), Extreme Value and Related Models in Engineering and Science Applications, New York: John Wiley & Sons. http://personales.unican.es/castie/extremes/ Data Set Name Table Number Wind 1.1 Flood 1.2 Wave 1.3 Epicenter 1.9 Precipitation 1.13

Papel de Probabilidades Plot (PPP) Trata-se de um método gráfico de validação preliminar de um modelo F(x;a,b), associado à característica sob estudo, X, com base numa amostra observada. Obtenção de um papel de probabilidades: 1ºpasso: encontrar uma transformação que expresse a equação numa forma linear, ie, através duma recta do tipo

Papel de Probabilidades Plot (PPP) amostra de dados observados: dados ordenados: Definam-se as “plotting positions”: Obtenção de um papel de probabilidades (cont.): 2ºpasso: marcar a núvem de pontos (plot) Se o Modelo subjacente é F(x;a,b) ...... os pontos dispõe-se aproximadamente ao longo da recta , i.e.,

Papel de Probabilidades Plot (PPP) Exemplo: Gumbel (máximos), com localização l ,escala d obtendo-se a relação linear:

Papel de Probabilidades Plot (PPP) Exemplo: Weibull (máximos), com localização l e escala d obtendo-se a relação linear:

Transformações para PPP g(p) h(x) PPP

Dados: “wave heights” – Tabela1.3 Wave Data → altura de onda máxima anual, em pés, observadas num dado local ao longo de 50 anos (construção de quebra-mar). Os dados foram obtidos em águas costeiras. O objectivo do estudo é construir um quebra-mar. A altura de onda é, por definição, uma variável aleatória não-negativa, limitada superiormente. Esta suposição é clara para águas costeiras, mas não evidente para o alto mar. amostra ordenada dos dados; dimensão : n=50 2.91 6.93 9.17 10.28 11.82 13.88 14.86 17.36 21.06 24.75 3.74 7.21 9.50 10.45 12.27 13.98 15.03 18.68 21.13 25.45 4.09 7.92 9.62 10.77 12.68 14.32 15.30 18.72 21.53 28.13 5.88 8.26 10.00 11.65 13.28 14.38 16.07 19.44 21.80 29.95 6.42 8.79 10.14 13.46 14.46 16.23 20.09 23.15 37.19

Dados: “wave heights” – Tabela1.3 plot - PPP

Dados: “wave heights” – Tabela1.3 Gumbel (máximos), com localização l ,escala d localização l ? escala d ?

Dados: “wave heights” – Tabela1.3 Gumbel (máximos) estimada qual a probabilidade da altura de onda máxima anual exceder 40 pés?

Dados: “wave heights” – Tabela1.3 Gumbel (máximos) estimada qual o nível de altura de onda para um período de retorno de 50 anos? Quer dizer: para um período de retorno de 50 anos, nível de altura de onda é h =34.85 pés

Q-Q plot – Tabela1.3 qualidade da Gumbel (máximos) estimada? versus Quer dizer: a núvem de pontos do Q-Q plot deverá estar sensivelmente ao longo da recta bissectriz do 1º quadrante.

P-P plot – Tabela1.3 qualidade da Gumbel (máximos) estimada? versus Quer dizer: os pontos do P-P plot deverão estar sensivelmente ao longo da recta bissectriz do 1º quadrante, no quadrado [0,1]x[0,1]

Dados: “Houmb” – Tabela1.6 Houmb’s Data → altura significativa de onda máxima anual, medidas em Miken-Skomvaer (Noruega) e publicados por Houmb e Overvik (1977). O objectivo do estudo é construir estruturas marítimas. amostra ordenada dos dados; dimensão : n=24 5.60 7.80 9.05 9.80 11.10 11.75 6.55 7.90 9.15 9.90 11.30 12.85 6.65 8.00 9.40 10.85 12.90 7.35 8.5 9.60 10.90 11.55 13.40

Dados: “Houmb” – Tabela1.6 Weibull de máximos ?? ...localização l =13.5 ??? plot - PPP

Dados: “Houmb” – Tabela1.6 Weibull de máximos ?? ...localização l =16 ??? plot - PPP

Dados: “Houmb” – Tabela1.6 Weibull de máximos ?? ...localização l =17 ??? plot - PPP

Dados: “Houmb” – Tabela1.6 plot - PPP Weibull de máximos ! ...localização l =13.5 ??? ...localização l =16 ??? ...localização l =17 ??? Prossiga-se com a estimação da escala d e forma a para: ... localização l =13.5 ...localização l =16 ...localização l =17 para a Weibull estimada Q-Q plots ... P-P plots ...

Quantis extremos: Normal ou Gumbel?? Modelo ?

Quantis extremos: Normal ou Gumbel?? Modelo ?

Quantis extremos: Normal ou Gumbel?? Modelo ? amostra gerada do modelo Gumbel !

Caudas Pesadas ou Leves ? Fazemos frequentemente uma distinção (mesmo que instintiva!...) entre distribuições “bem-comportadas” e distribuições “perigosas” com cauda pesada A classe das distribuições “bem-comportadas” consiste naquelas distribuições com cauda limitada exponencialmente, → grandes observações não são impossíveis, mas a probabilidade de ocorrência decresce a uma velocidade exponencial para zero, à medida que o nível de patamar se torna cada vez maior. → caudas leves. Por outro lado, uma das principais preocupações é a detecção de distribuições consideradas “perigosas” → distribuições de cauda pesada → não existe um limite exponencial, sendo mais provável que se obtenham grandes observações. As grandes observações exercem forte influência na soma total das observações.

Caudas Pesadas, Índice de Cauda e Momentos valor médio infinito Variância finita Variância infinita, valor médio finito

Standard&Poor’s 500 (S&P500) Valores de fecho da S&P500 de: Janeiro80 até sexta-feira, 16 Outubro87 S&P500 19 Outubro87(2ªfeira negra) – fim de Fevereiro88

Dados – log-retornos diários S&P500 Amostra: Janeiro60 até sexta-feira, 16 Outubro87 (dimensão = 6985)

S&P500: Valores relevantes a partir de Janeiro de 1960? Sub-Amostra de topo: os 3312 valores positivos de

Distribuições de cauda pesada no mercado financeiro Os log-retornos exibem frequentemente caudas pesadas Estamos interessados num certo nível elevado, o qual será excedido com uma pequena probabilidade quantil extremal VaR (Value-at-Risk) Exemplo: 16 Outubro 1987 – Um gestor de risco quer saber o risco associado ao investimento estimar a % de queda diária do índice S&P500 que ocorra só uma vez em 40 anos 10.000 dias ≈ 40 x 250dias úteis

Problema a tratar: AMOSTRA Estamos interessados em estimar xp de F tal que: A tratar previamente: Os log-retornos exibem caudas pesadas? Estimação de g para caudas pesadas? (parâmetro de 1ª ordem g ) Ajustamento de modelos extremais, etc ... ???

Ajustamento da GVE aos Máximos Anuais - MMA Inclusão de parâmetros de localização l e escala d na GVE índice de cauda (forma) g Bloco 1 Bloco 2 Bloco 3 Bloco 4 Bloco 5

A distribuição Generalizada de Pareto (GP) A GP engloba os modelos: Pareto: Cauda pesada Beta: Suporte limitado Exponencial: Cauda leve

Excessos acima de um nível elevado - POT Balkema-de Haan’74+Pickands’75 u

Abordagem semi-paramétrica Maiores Observações (MO) e.o. intermédia superior

Testes de detecção do peso da cauda O parâmetro de forma g determina o peso da cauda Escolha entre Domínios de Atracção ou

Peaks Over Random Threshold - PORT Excessos Acima do Nível Aleatório

r-Momento dos Excessos Abordagem Maiores Observações Excessos acima do Nível Aleatório r-Momento dos Excessos

Razão entre o Máximo e a Média dos Excessos - NPFA (Neves&Picek&FAlves.(2006)) Não depende da localização nem da escala Motivação: comportamento diferenciado da razão entre o máximo e a média para caudas leves e pesadas

Estatística de Hasofer e Wang - HW (Hasofer & Wang ‘92) Não depende da localização nem da escala Motivação: tem por base a estatística de ajustamento de Shapiro-Wilk ‘65

Estatística de tipo Greenwood - Gt Não depende da localização nem da escala Motivação: tem por base a estatística de Greenwood ’46

Relação entre HW e Gt Reescreva-se HW sob a égide de Gt, (Neves and Fraga Alves, ´06)

Testes de nível assintótico a sob H0 : As estatísticas de Teste normalizadas são assintoticamente normais para sequências intermédias: e - quantil da Normal Rejeitar H0 (caudas leves) em favor de H1 (bilateral) se: Rejeitar H0 (caudas leves) em favor de H1 (caudas pesadas) se: Rejeitar H0 (caudas leves) em favor de H1 (caudas curtas) se:

Testes de nível assintótico a sob H0 : A estatística de Teste normalizada Gumbel quantile é assintoticamente Gumbel para sequências intermédias: Rejeitar H0 (caudas leves) em favor de H1 (bilateral) se: Rejeitar H0 (caudas leves) em favor de H1 (caudas pesadas) se: Rejeitar H0 (caudas leves) em favor de H1 (caudas curtas) se:

DADOS Bilbao – 179 observações “zero-crossing” médias horárias (em segs) das ondas do mar, medidas na bóia de Bilbao em Janeiro de 1997, tendo sido retidos apenas os valores superiores a 7 segs. (influência dos períodos na morfodinâmica da praia relacionados com a cauda direita da distribuição subjacente) Ozono – 731 observações níveis de ozono (em partes por billião) registados por hora em Harris County durante 1980 - 1993. S&P500 – 6985 observações série de valores de fecho do índice financeiro S&P500 (log-retornos), de Janeiro1960 até à sexta feira, 16 Outubro 1987 (dia anterior ao “crash” da 2ª feira Negra, 16 Outubro 1987).

Bilbao waves data Amostra : (dimensão = 179) g0.05

Ozone data Amostra : (dimensão = 731)

S&P500 Amostra: (dimensão = 6985)

Algumas Referências Balkema, A., and de Haan, L.(1974). Residual lifetime at great age. Ann.Probab.2, 792-804. Beirlant, J., Goegebeur, Y., Segers, J. and Teugels, J.(2004). Statistics of Extremes: Theory and Applications. John Wiley & Sons. Castillo, E., Hadi, A. S., Balakrishnan, N. and Sarabia, J. M., (2005). Extreme Value and Related Models in Engineering and Science Applications, New York: John Wiley & Sons. Embrechts,P., Kluppelberg,C. e Mikosch, T. (1997). Modelling Extremal Events. Springer-Verlag. Gnedenko, B.V., (1943). Sur la distribution limite du terme maximum d’une série aléatoire. Ann.Math.44, 423-453. Greenwood, M. (1946). The statistical study of infectious diseases. J. Royal Stat. Soc., Ser. A, 109, 85—109 de Haan, L. (1984). Slow variation and characterization of domains of attraction. In: Statistical Extremes and Applications (J. Tiago de Oliveira, ed.), 31-48 Reidel Publishing, Dordrecht. de Haan, L. (2006). On Extreme Value Theory . Or: How to Learn from Almost Disastrous Events. Gulbenkian Lecture presented on the 22nd February 2006. Edições CEAUL. Hasofer, A.M. e Wang, Z. (1992). A test for extreme value domain of attraction. JASA, Vol. 87, 171-177. Neves, C., Picek, J. and Fraga Alves, M.I.(2006). Contribution of the maximum to the sum of excesses for testing max-domains of attraction. JSPI, 136, 4, 1281-1301. Neves, C. and Fraga Alves, M.I.(2006). Semi-parametric Approach to Hasofer-Wang and Greenwood Statistics in Extremes. To appear in TEST. Pickands III, J.(1975). Statistical Inference using extreme order statistics. Ann.Statist.3, 119-131. Reiss, R.-D. and Thomas, M. (2001). Statistical Analysis of Extreme Values, with Applications to Insurance, Finance,Hydrology and Other Fields. 2nd ed. Birkhauser. Verlag.