Análisis de extremos

Análisis de extremos
Referencias
• Wilks (sección 4.4.5): “dice mucho, explica poco”
• Coles (2001) “An Introduction to Statistical
Modeling of Extreme Values”
Repaso conceptos útiles
• Período de retorno (Tr)
• Simulación de números aleatorios con una
distribución dada
Máximos anuales
• Nuestra variable aleatoria va a ser Mn:
con X1,…,Xn una secuencia de variables aleatorias
independientes con la misma distribución F(x).
• Distribución GEV
Máximos anuales
• Ajuste de los parámetros de la distribución GEV
(1) Máxima verosimilitud
(2) Probability Weighted Moments (PWM;
combinación lineal de momentos de la
distribución)
Máximos anuales
• Cálculo de intervalos de confianza
(1) Método Delta
(2) Perfil de verosimilitud (profile likelihood)
(3) Métodos basados en Bootstrapping noparamétrico y paramétrico (muestreo aleatorio y
simulación)
Máximos anuales
• Intervalos de confianza: Bootstrapping no-paramétrico
(1) Se muestrean N nuevas muestras con repetición a
partir de la muestra original
(2) A cada nueva muestra se le ajusta la GEV y se calcula
el cuantil de interés
(3) Se estiman intervalos de confianza a partir de datos
generados
(4) Se corrige el sesgo de los intervalos de confianza
usando los resultados obtenidos con la serie original
MATLAB: bootci ; hay que programar función auxiliar
Máximos anuales
• Intervalos de confianza: Bootstrapping paramétrico
• Aproximación tradicional; dada GEV ajustada con
muestra original:
(1) Se simulan N series de igual duración que la muestra
original
(2) A cada serie se le ajusta una GEV y se calcula el
cuantil de interés
(3) Se estiman intervalos de confianza a partir de datos
generados
MATLAB: hay que programarlo (gevrnd)
Máximos anuales
• Intervalos de confianza: Bootstrapping paramétrico
• Aproximación alternativa; dada GEV ajustada con
muestra original:
(1) Se estima matriz de covarianza de los parámetros
(2) Se simulan N conjuntos de parámetros usando la
matriz de covarianza
(3) Se estima el cuantil objetivo con cada conjunto de
parámetros
(4) Se estiman intervalos de confianza a partir de datos
generados
MATLAB: hay que programarlo (mvnrnd)
Máximos anuales
• Matriz de covarianza:
Matriz de covarianza de los parámetros para ajuste
ML: función gevlike
Matriz de covarianza de los parámetros para ajuste
PWM hay que programarla usando
Ejemplo máximos anuales
• Análisis de extremos de la altura de ola significante
en la costa de Rocha
x 10
Profundidad (mWh)
6
25
6.21
20
5
6.2
10
15
20
22.5
Y (UTM zona 22H)
6.19
15
25
20
6.18
25
15
20
6.17
ADCP
10
22.5
10
15
6.16
10
20
B11
5
15
25
Condición de borde
6.15
1.9
2
2.1
2.2
2.3
X (UTM zona 22H)
2.4
2.5
2.6
x 10
5
0
Ejemplo máximos anuales
Máximo Hm0 Anual [m]
6
4
2
0
1980
1985
1990
1995
Año
2000
2005
2010
Ejemplo máximos anuales
Distribución de extremos GEV de Hm0 (Omnidireccional)
Altura de ola significante espectral Hm0 [m]
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
Altura de ola significante espectral Hm0 [m]
8
6
4
2
10
0
10
10
Período de retorno [años]
0
2
SSE
10
8
6
4
2
10
Período de retorno [años]
2
10
8
6
4
2
10
0
10
10
Período de retorno [años]
0
2
S
10
8
6
4
2
10
Período de retorno [años]
2
Altura de ola significante espectral Hm0 [m]
E
Altura de ola significante espectral Hm0 [m]
10
Altura de ola significante espectral Hm0 [m]
ENE
Altura de ola significante espectral Hm0 [m]
Altura de ola significante espectral Hm0 [m]
ESE
10
8
6
4
2
10
0
10
10
Período de retorno [años]
0
2
SSW
10
8
6
4
2
10
Período de retorno [años]
2
Altura de ola significante espectral Hm0 [m]
Ejemplo máximos anuales
SE
10
8
6
4
2
10
0
10
Período de retorno [años]
2
Ejemplo máximos anuales
Ejemplo máximos anuales
Distribución de extremos GEV de Hm0 (Omnidireccional)
Distribución de extremos GEV de Hm0 (Direccional)
11
Altura de ola significante espectral Hm0 [m]
Altura de ola significante espectral Hm0 [m]
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
10
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
Picos sobre el umbral
Picos sobre el umbral
• Distribución de Pareto Generalizada
• sigma
• xi
 parámetro de escala
 parámetro de forma
•u
 umbral / parámetro de posición
Picos sobre el umbral
• Estimación de los parámetros
(1°) Determinar umbral adecuado (criterios físicos
más evaluación de ajuste)
(2°) Estimación de parámetros de escala y forma
Picos sobre el umbral
• Determinación del umbral
• Mean Residual Life Plot (MRLP)
• Gráficos de xi y sigma*
Picos sobre el umbral
• MRLP
• Si los datos Xi tal que Xi>uo provienen de una
distribución generalizada de Pareto (GPD) entonces
Picos sobre el umbral
• MRLP
• No requiere estimar
los parámetros de la
distribución
• Los I.C. se calculan
como los de la media
Picos sobre el umbral
• Gráfico de parámetros
• Requiere estimar los parámetros de la distribución
• Los I.C. se calculan con método delta
Picos sobre el umbral
0.8
Forma
0.6
• Los I.C. se calculan con método delta (también
pueden calcularse con
0.5bootstrapping)
0.4
1
2
3
4
0
0.2
-0.5
-1
5
-1.5
1
2
3
4
Escala*
10
0
-0.4
5
1
1.5
4
20
0
-0.2
6
30
Picos por año
0.4
PoissonHyp
MRLP GPD
• Requiere estimar los parámetros de la
0.7
distribución
0.5
AutoCorr
0.9
• Gráfico de parámetros
2
1
0.5
0
1
2
3
Umbral
4
5
-2
1
2
3
Umbral
4
5
0
1
Picos sobre el umbral
• ¿Cómo trabajar si la serie no es independiente?
• Generando serie de picos sobre el umbral (serie POT):
• Opción 1: definir un umbral uPOT y un tiempo mínimo entre
picos T1
• Opción 2: usar una ventana móvil de tiempo T2 y retener los
picos que coinciden con el centro de la ventana
• Luego, para cada umbral u ( u>min(Xi) ) se obtiene, para
cada una serie de valores POT independientes y un
número medio de picos por año
Picos sobre el umbral
• Uso del número medio de picos por año
Altura de ola significante espectral Hm0 [m]
1
Tr 
1  P( Z  Z S ) 
Distribución de extremos POT de Hm0 (Humb=3,5 m)
6
5.5
5
4.5
4
3.5
3
-1
10
0
1
10
10
Período de retorno [años]
2
10
Picos sobre el umbral
• Ejemplo: oleaje Rocha
0.7
Forma
0.6
0.2
-1
1
2
3
4
5
-1.5
1
2
3
4
Escala*
10
0
-0.4
5
1
2
1
2
1.5
4
20
0
-0.2
6
30
Picos por año
0
-0.5
0.5
0.4
0.4
PoissonHyp
MRLP GPD
0.8
0.5
AutoCorr
0.9
2
1
0.5
0
1
2
3
Umbral
4
5
-2
1
2
3
Umbral
4
5
0
U
Picos sobre el umbral
• Ejemplo: oleaje Rocha
Distribución de extremos POT de Hm0 (Humb=2,8 m)
Distribución de extremos POT de Hm0 (Humb=3,5 m)
9
Altura de ola significante espectral Hm0 [m]
Altura de ola significante espectral Hm0 [m]
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
Picos sobre el umbral
• Estimación de parámetros:
• Máxima verosimilitud (ML): gpfit
• Probability Weighted Moments (PWM)
Picos sobre el umbral
• Cálculo de cuantiles de alto período de retorno:
• Se requiere: umbral, parámetros de forma y escala
estimados y número medio de eventos por año
𝑋𝑇𝑟
𝜎
= 𝑢 + ( 𝑇𝑟 𝜈
𝜉
𝜉
− 1)
Picos sobre el umbral
• Cálculo de intervalos de confianza
(1) Método Delta
(2) Perfil de verosimilitud (profile likelihood)
(3) Métodos basados en Bootstrapping noparamétrico y paramétrico (muestreo aleatorio y
simulación)
Picos sobre el umbral
• Ejemplo: oleaje Rocha
Distribución de extremos POT de Hm0 (Humb=3,5 m)
0.6
0.2
-1
1
2
3
4
5
-1.5
1
2
3
4
0
1
1.5
PoissonHyp
Escala*
10
0
-0.4
5
4
20
9
-0.2
6
30
Picos por año
0
-0.5
0.5
0.4
0.4
2
1
0.5
0
1
2
3
Umbral
4
5
-2
1
2
3
Umbral
4
5
0
1
Altura de ola significante espectral Hm0 [m]
0.7
Forma
MRLP GPD
0.8
0.5
AutoCorr
0.9
8
7
26
3
4
5
0 4
3
10
Umbral
5
5
4
3
2
1
2
10
10
Período de retorno [años]
3
10
Picos sobre el umbral
600
500
# Eventos
400
300
200
100
0
E
SE
Dirección
S
Altura de ola significante espectral Hm0 [m]
E
10
8
6
4
2
0
10
1
2
10
10
Período de retorno [años]
3
10
S
10
8
6
4
2
0
10
1
2
10
10
Período de retorno [años]
3
10
Altura de ola significante espectral Hm0 [m]
Altura de ola significante espectral Hm0 [m]
Picos sobre el umbral
SE
10
8
6
4
2
0
10
1
2
10
10
Período de retorno [años]
3
10
Picos sobre el umbral
Distribución de extremos POT de Hm0 (Direccional)
Altura de ola significante espectral Hm0 [m]
11
10
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
MA y POT omnidireccional
Distribución de extremos GEV de Hm0 (Omnidireccional)
Distribución de extremos POT de Hm0 (Humb=3,5 m)
9
Altura de ola significante espectral Hm0 [m]
Altura de ola significante espectral Hm0 [m]
9
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
8
7
6
5
4
3
0
10
1
2
10
10
Período de retorno [años]
3
10
MA y POT direccional
Distribución de extremos GEV de Hm0 (Direccional)
12
Altura de ola significante espectral Hm0 [m]
11
10
Máximos anuales
Picos sobre el umbral
GEV (con 7 direcciones)
GPD (con 3 direcciones)
9
8
7
6
5
4
3
0
10
1
10
Período de retorno [años]
2
10