A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Using Predictive Analytics to Forecast Drone Attacks in Pakistan

Apresentações semelhantes


Apresentação em tema: "Using Predictive Analytics to Forecast Drone Attacks in Pakistan"— Transcrição da apresentação:

1 Using Predictive Analytics to Forecast Drone Attacks in Pakistan
Uzma Afzal Federal Urdu University of Arts Science & Technology Karachi, Pakistan Dr. Tariq Mahmood PAF - Karachi Institute of Economics & Technology Karachi, Pakistan ADAILSON COMEÇA Adailson de Castro Marcio Mendes

2 Roteiro Contextualização Objetivo Dados Ferramentas Preprocessamento
Modelagem e Forecasting Conclusão

3 Drones Unmanned Aerial Vehicles (UAV) or
Remotely Piloted Aerial Systems (RPAS). São empregados, no âmbito militar, em condições onde o vôo tripulado é considerado difícil e arriscado.

4 Drones

5 Drones

6 Objetivo Aplicar tecnicas de previsão para medir futuros danos
E prever ataques futuros para salvar vidas inocentes

7 Os Ataques -Ataques se tornaram frequentes no Pakistão desde 2004
-Centenas de ataques ocorreram entre 2004 e 2013 -São parte da campanha Guerra Contra Terrorista, comandada pelos Estados Unidos. -Apesar dos ataques serem direcionados aos terroristas, milhares de inocentes morreram nestes ataques.

8 Os Ataques Ataques se tornaram frequentes no Pakistão desde 2004
Centenas de ataques ocorreram entre 2004 e 2013 São parte da campanha Guerra Contra Terrorista, comandada pelos Estados Unidos. Apesar dos ataques serem direcionados aos terroristas, milhares de inocentes morreram nestes ataques.

9 Fontes Pakistan Body Count (PBC) Website
Cruzamentos das correspondencias com entradas na wikipedia South Asia Terrorism Portal (SATP) Website Cerca de 340 ataques registrados, desde Junho/2004 até junho/2013 >>MARCIO COMEÇA<<

10 Atributos Aplica tecnicas basicas de pre-processamento
Elimina atributos não-numéricos que (Não fez sentido pro objettivos deles discretizar o atributo “Lugar”) Não há informações faltosas nos dados coletados

11 Atributos Ainda aplicando técnicas basicas de pré-processamento
Os dados originais estão em data completa, serão TRANSFORMADOS

12 Atributos Média Obliquidade Curtose
Skewness (assimetria) – Desvio da distribuição normal simétrica Kurtosis (curtose) – Concentração de distribuição (se a variavel tem muitos ou pocos valores diversos) Curtose

13 Atributos Número de ataques JUN 2004 JUN 2013

14 Atributos Mortes de Militantes JUN 2004 JUN 2013

15 Atributos Mortes de civis JUN 2004 JUN 2013

16 Atributos Feridos JUN 2004 JUN 2013

17 Atributos Sobreposição JUN 2004 JUN 2013 Numero de ataques
Obs.: Escala Aproximada Numero de ataques Mortes de civis Mortes de militantes Sobre posição de Numero de ataques Mortes de civis Mortes de militantes JUN 2004 JUN 2013

18 Série temporal Estacionária
Uma série temporal é dita estacionária quando ela se desenvolve no tempo aleatoriamente ao redor de uma média constante, refletindo alguma forma de equilíbrio estável. O que facilita a previsão. >>ADAILSON COMEÇA<<

19 Transformação Nâo Estacionária -> estacionária
 Diferenças sucessivas da série original Primeira diferença: Segunda diferença: N-ésima diferença:

20 Transformação Estacionária -> Não estacionária
 Diferenças sucessivas da série original

21 Trend Trend, ou tendência , é o movimento de uma serie tempo a longo prazo Exemplo

22 Season Seasonality, ou sazonalidade , é o movimento de uma serie temporal em intervalos menores que um ano. Mensalmente, semanalmente, diariamente , e.g. Exemplo Não eh recomendado para series com tendências e sazonalidade

23 Transformação Estacionária -> Não estacionária
Não é dito no artigo, mas provavelmente foram feitos testes de estacionaridade nas series temporais dos 4 parâmetros. Provavelmente também foi descoberto que as mesmas eram não estacionárias (um tanto quanto óbvio pelos gráficos), por isso a necessidade de se aplicar a transformação por uma função de diferenciação. Como é dito no artigo: “In all four graphs, the mean value is changing across different time periods, signaling the need to apply a differencing function across consecutive time Periods [...]”

24 Partial Auto correlation function (PACF)
É usado uma função de auto correção parcial(Partial Auto correlation function, PACF) para identificar a extensão do “lag”(atraso) no modelo Seja um valor da serie temporal no tempo t: Auto correlação parcial do lag 1: - LAG – atraso (diferença de um parametro entre um instante e outro em um dado intervalo) - Análise de corelação, onde, se a barra passar tanto do limiar positivo quanto do negativo existe uma correlação. - Fig. ATAQUES and MORTES DE CIVIS show high PAC in first two lags, - Fig. MORTES DE MILITANTES and FERIDOS show high PAC in first and fourth lags. Based on these charts, we select the relevant auto-correlation parameter for the ARIMA model configuration (defined in next section). Auto correlação parcial do lag k:

25 Partial Auto correlation function (PACF)
- LAG – atraso (diferença de um parametro entre um instante e outro em um dado intervalo) - Análise de corelação, onde, se a barra passar tanto do limiar positivo quanto do negativo existe uma correlação naquele lag para a quela variável. - Fig. ATAQUES and MORTES DE CIVIS show high PAC in first two lags, - Fig. MORTES DE MILITANTES and FERIDOS show high PAC in first and fourth lags. Based on these charts, we select the relevant auto-correlation parameter for the ARIMA model configuration (defined in next section).

26 IBM SPSS Tool Exponential Smoothing Automated Expert Modeler
>>MARCIO COMEÇA AQUI<< Exponential Smoothing Automated Expert Modeler Autoregressive Integrated Moving Average (ARIMA)

27 Exponential Smoothing
Valor observado no instante inicial 𝑆 0 = 𝑋 0 𝑆 𝑡 =𝛼 𝑋 𝑡−1 +(1- 𝛼) 𝑆 𝑡−1 Previsão no tempo “t” 0<𝛼<1 A versão mais simples desse algoritmo não eh mt bom para series com tendências e sazonalidade Smoothing Factor (“Fator Suavizante”, tradução livre)

28 Autoregressive Integrated Moving Average
ARIMA Autoregressive Integrated Moving Average Modelo ARIMA (p, d, q) ≡ ARIMA (autoregressive, Integrated, Moving) Número de parâmetros auto-regressivos, Número de diferenças número de parâmetros da média móvel 1− 𝑖=1 𝑝 𝜑 𝑖 𝐿 𝑖 1−𝐿 𝑑 𝑋 𝑡 = 𝛿+ 1+ 𝑖=1 𝑞 𝜃 𝑖 𝐿 𝑖 𝜀 𝑡 >>OS DOIS<< ARIMA models are better than exponential smoothing for the series with trends and seasonality. 𝐿 𝑖 = 𝑋 𝑡−𝑖 / 𝑋 𝑡 Lag Operator 𝑋 𝑡 − 𝑋 𝑡−1 = 𝜀 𝑡 Erro

29 Autoregressive Integrated Moving Average
ARIMA Autoregressive Integrated Moving Average 𝑌 𝑡 = 1−𝐿 𝑑 𝑋 𝑡 1− 𝑖=1 𝑝 𝜑 𝑖 𝐿 𝑖 1−𝐿 𝑑 𝑌 𝑡 = 𝛿+ 1+ 𝑖=1 𝑞 𝜃 𝑖 𝐿 𝑖 𝜀 𝑡 >>OS DOIS<< ARIMA models are better than exponential smoothing for the series with trends and seasonality. 𝑌 𝑡 = 𝛿+ 1+ 𝑖=1 𝑞 𝜃 𝑖 𝐿 𝑖 𝜀 𝑡 1− 𝑖=1 𝑝 𝜑 𝑖 𝐿 𝑖 1−𝐿 𝑑

30 Dados observados vs Forecast
Expert Modeler >>Márcio<< Dados observados Forecast

31 Dados observados vs Forecast
ARIMA Modelado Manualmente Dados observados Forecast

32 Comparação de erros Root Mean Squared Error (RMSE)
>>ADAILSON<< Erro médio quadrático Root Mean Squared Error (RMSE)

33 Expert Modeler Dados observados Forecast

34 ARIMA Modelado Manualmente

35 Forecast

36 Forecast Julho 2013: 2(ataques), 17 (militantes), 2(estrangeiros), 0 (feridos) Agosto 2013: Não houve ataques Setembro 2013: 3(ataques), 6 (militantes), 12(civis e estrangeiros), 9 (feridos) Outubro 2013: 2(ataques), 5 (militantes), 3(civis), 5 (feridos) Novembro 2013: 2(ataques), 2 (militantes), 6(civis e estrangeiros), 10 (feridos) Dezembro 2013: 2(ataques), 0 (militantes), 9(civis), 3 (feridos)

37 Dados atuais

38 Comparação do ARIMA e EM em 2012

39 Conclusão O Expert Modeler, no IBM SPSS, se mostrou melhor, com menos erros que o ARIMA Modelado Manualmente. Os ataques tem grande número de civis mortos comparados com as mortes de militantes.

40 Obrigado, dúvidas?

41 Algoritmos: http://www. itl. nist


Carregar ppt "Using Predictive Analytics to Forecast Drone Attacks in Pakistan"

Apresentações semelhantes


Anúncios Google