A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

BUSINESS INTELLIGENCE MASTER

Apresentações semelhantes


Apresentação em tema: "BUSINESS INTELLIGENCE MASTER"— Transcrição da apresentação:

1 BUSINESS INTELLIGENCE MASTER
Projeto de Sistema Inteligente de Apoio à Decisão

2 ESTUDO DE CASO 2: Inferência da Qualidade de Produtos de Destilação

3 Metodologia Identificação do Problema Estudo do Problema
Diagnóstico da situação atual Definição dos objetivos Avaliação e análise dos dados disponíveis Definição de Escopo do Projeto MODELAGEM: Esboço da Metodologia para solução do problema Desenvolvimento Testes Avaliação Implementação da(s) alternativa(s) escolhida(s) Avaliação dos resultados Revisão da solução SBAI2009

4 Identificação do Problema
Refinarias produzem diferentes produtos, com características distintas, dependendo da destinação do produto Essas características são resultantes da configuração da torre de destilação (temperatura, pressão, vazão, etc.)

5 Identificação do Problema
Diesel Gasolina Querosene Gases Nafta ... He Fe Ni O2 S P C H Características geológicas definem o aspecto físico e a composição química. 5

6 Identificação do Problema
Dentro das variáveis de processo destaca-se a importância de quatro grandezas físicas que representam 90% do controle necessário para a produção de derivados, são elas: Pressão, Temperatura, Vazão e Nível. 6

7 Identificação do Problema
Refinarias produzem diferentes produtos, com características distintas, dependendo da destinação do produto Essas características são resultantes da configuração da torre de destilação (temperatura, pressão, vazão, etc.) Como garantir que o produto resultante esteja sempre dentro das especificações desejadas? 7

8 Identificação do Problema
É necessário um monitoramento constante da qualidade dos produtos de destilação Análise de laboratório demanda muito tempo Analisadores de processo on-line são muito caros

9 Estudo do Problema Diagnóstico da situação atual:
Atualmente a qualidade do produto é analisada em laboratório Cada análise demanda em torno de 4 a 5 horas  média de 4 a 5 valores por dia

10 Estudo do Problema Definição dos objetivos:
Desenvolver um sistema de monitoramento online, capaz de avaliar continuamente a qualidade dos produtos derivados do petróleo

11 Estudo do Problema Avaliação dos dados disponíveis:
Refinaria do Paraná (REPAR), operada pela Petrobras Janeiro de 2000 a Junho de 2001 Um valor por minuto (total de valores) 81 sensores distribuídos ao longo da planta Variável de qualidade do produto: Temperatura do ponto de destilação de 85% do óleo Diesel (ASTM) 3 valores por dia (total de valores)

12 Estudo do Problema Avaliação dos dados disponíveis: Características
Entrada=Leitura de 81 instrumentos armazenando um valor por minuto; Saída=Análise laboratorial; Período de 1 ano.

13 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência 13

14 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência Limpeza Segmentação Validação Normalização Equalização

15 Modelagem Análise dos Dados
Pré-Processamento dos Dados: Análise dos Dados Valores discrepantes e falhas de aquisição; Metade dos dados estavam sem a definição dos respectivos instrumentos; Faixas de medição inconsistentes com faixas de operação; Sensores com pouquíssimas ou nenhuma variação durante todo o ano.

16 Modelagem Limpeza: Ações tomadas:
Pré-Processamento dos Dados: Limpeza: Ações tomadas: Eliminação de instrumentos com sensoriamento danificado; Verificação dos dados que estavam sem identificação de instrumento; Adequação das faixas de operação de cada instrumento cruzando a informação fornecida pelo CENPES. Substituição dos instantes sem leitura pelos períodos anteriores.

17 Modelagem Entradas Saída Resultado da Limpeza:
Pré-Processamento dos Dados: Resultado da Limpeza: Entradas Saída

18 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência Limpeza Segmentação Validação Normalização Equalização

19 Modelagem Segmentação: Saída Entradas #1 #2
Pré-Processamento dos Dados: Segmentação: Saída Entradas #1 #2

20 Modelagem Segmentação: Resultado: Pré-Processamento dos Dados:
A saída aglomera as transições que representam as análises de laboratório e as entradas transformam-se em 771 janelas com instantes anteriores à transição da saída.

21 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência Limpeza Segmentação Validação Normalização Equalização

22 Eliminação das janelas com baixa relevância ao processo
Modelagem Pré-Processamento dos Dados: Validação: Ações tomadas: Eliminação das janelas com baixa relevância ao processo Para cada variável do processo calculou-se a Média (m) e o Desvio Padrão (d); Arbitrou-se que, se o ponto pertencente à variável estivesse acima da faixa m+1,96*d ou abaixo de m-1,96*d, este deveria ser sinalizado. Se o número destes pontos excedesse 11% do total, esta variável era marcada como defeituosa. Se o número de variáveis defeituosas fosse maior que 12% a janela deveria ser rejeitada. Resultado: As janelas de entradas foram reduzidas de 771 para 664.

23 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência Limpeza Segmentação Validação Normalização Equalização

24 Modelagem Pré-Processamento dos Dados: Normalização:  dados medidos pelos sensores diferem enormemente em unidades e valores. Padrão: remover o valor médio de cada sinal e dividi-lo por seu desvio padrão  média zero, variância unitária  difícil implementação na prática Faixa de variação: usa a faixa nominal de cada sensor i  limitada por [0,1]

25 Modelagem Normalização:
Pré-Processamento dos Dados: Normalização: Normaliza os dados de entrada e saída convertendo seus valores para faixa de 0 a 1; Isto facilita o treinamento da rede usando função de ativação sigmóide. 25

26 Modelagem Pré-Processamento dos Dados: Normalização:

27 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência Limpeza Segmentação Validação Normalização Equalização

28 Modelagem Equalização:
Pré-Processamento dos Dados: Equalização: Equaliza a saída do sistema através do histograma dos dados. (0-1).

29 Modelagem Equalização: Vantagens deste processamento
Pré-Processamento dos Dados: Equalização: Vantagens deste processamento Em termos práticos, esta ação melhora a faixa dinâmica de utilização do neurônio de saída, evitando que os mesmos atuem somente em uma pequena porção da faixa ativa.

30 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis Definição dos padrões de i/o Inferência Devido ao grande número de variáveis de entrada (81), as seguintes técnicas para seleção de variáveis foram usadas: Análise de Componentes Principais (PCA) Correlação Cruzada (CORR) Determinação Automática de Relavância (ARD) Estimador por Mínimos Quadrados (LSE)

31 Inferência por Redes Neurais Bayesianas
Modelagem Seleção de Variáveis: Análise de Componentes Principais: Uma das técnicas mais usadas na indústria do petróleo Algoritmo multivariável que projeta os dados em um espaço de menor dimensão Procedimento para seleção de variáveis: selecionar um número L de componentes principais tais que a variância cumulativa seja 95% da variância total. Inferência por Redes Neurais Bayesianas 31

32 Inferência por Redes Neurais Bayesianas
Modelagem Seleção de Variáveis: Correlação Cruzada: Principal desvantagem do PCA: considera somente a matriz de entrada, e não sua relação com o vetor de saída A correlação cruzada intrinsecamente considera tal relação. Inferência por Redes Neurais Bayesianas 32

33 Modelagem Correlação: Objetivo
Seleção de Variáveis: Correlação: Objetivo Indicar as variáveis de entrada que melhor se relacionam com a saída inferida. Determinar os atrasos (dead times) correspondentes a cada variável. 33

34 Inferência por Redes Neurais Bayesianas
Modelagem Seleção de Variáveis: Correlação Cruzada: Principal desvantagem do PCA: considera somente a matriz de entrada, e não sua relação com o vetor de saída A correlação cruzada intrinsecamente considera tal relação. O algoritmo original foi adaptado para considerar as diferentes taxas de amostragem para entrada e saída: Inferência por Redes Neurais Bayesianas 34

35 Inferência por Redes Neurais Bayesianas
Modelagem Seleção de Variáveis: Correlação Cruzada: Utilizada para dois propósitos: cálculo de médias seleção de variáveis Para seleção de variáveis: calcular a função ci() para todas as 81 variáveis; determinar o valor máximo dessa função para cada variável; selecionar as variáveis com maiores valores de correlação. Inferência por Redes Neurais Bayesianas 35

36 Modelagem Seleção de Variáveis: Correlação Cruzada: Dead-time

37 Modelagem Estimador de Mínimos Quadrados (LSE): Aplicando
Seleção de Variáveis: Estimador de Mínimos Quadrados (LSE): Aplicando Considerando um sistema de n entradas (X) e 1 saída (Y), o método LSE calcula a importância da iésima variável de entrada estimando o iésimo parâmetro b da função (Y = X*b) que descreve a variação da variável da saída em relação a cada iésima de entrada sobre o conjunto de dados. Ps. Faz-se uma regressão multivariável das variações das entradas em relação à variação da saída, obtendo o vetor de coeficientes b.

38 Modelagem Estimador de Mínimos Quadrados (LSE): Supondo:
Seleção de Variáveis: Estimador de Mínimos Quadrados (LSE): Supondo: X= entradas do sistema [664x37]/janela Y= saídas do sistema [664x1]/janela Então teremos:

39 Modelagem Estimador de Mínimos Quadrados (LSE): Supondo:
Seleção de Variáveis: Estimador de Mínimos Quadrados (LSE): Supondo: X = Diferença entre entradas Y = Diferença entre Saídas

40 Modelagem Estimador de Mínimos Quadrados (LSE): Aplicando
Seleção de Variáveis: Estimador de Mínimos Quadrados (LSE): Aplicando Para encontrar o b: Y = X x b => b = X-1 x Y Recurso matemático: Cálculo da Pseudo Inversa: b = ((X’ x X)-1 x X’) x Y Grau LSE = abs(b)./sum(abs(b));

41 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões i/o Inferência Preparando sinais p/o Treinamento da Rede Neural

42 Modelagem Preparação: Objetivos Definição dos Padrões I/O:
Definir, sobre os dados de entrada e saída, os grupos para executar a validação cruzada; Aplicar a média em torno da correlação máxima em cada janela para redução de ruídos.

43 Modelagem Preparação: Validação Cruzada Definição dos Padrões I/O:
Foram criados 3 grupos de dados: Um de treino composto por 60% da informação, um de validação com 30% e um de teste com 10% dos dados. Ps. Cabe como observação que os termos foram aglomerados intercalando os valores para não viciar a rede.

44 Modelagem Preparação: Média para Redução de Ruído
Definição dos Padrões I/O: Preparação: Média para Redução de Ruído Considerando que cada janela tem 360 instantes e está referenciada a um valor de saída, calculou-se a média dos 60, 120, 180, 240 e 300 termos vizinhos ao atraso definido pela correlação máxima anteriormente. Ps. A escolha da quantidade de vizinhos necessários para absorver a essência do sinal não foi baseada em heurística, mas em testes sistemáticos.

45 Modelagem Média  reduzir a desproporção entre os valores de entrada e saída e reduzir o ruído Aritmética Ponderada Melhor valor Na = 60, correspondente a uma hora. Atraso temporal entre sensores de entrada e inferência de saída Melhor valor Nc = 180, correspondente a três horas. Melhor função de ponderação: correlação cruzada = ci(). Inferência por Redes Neurais Bayesianas

46 Modelagem Etapas do Trabalho Pré-Processamento Seleção de Variáveis
Definição dos padrões de i/o Inferência REde Neural MLP Instrumentos selecionados

47 Testes Métrica de avaliação: Avaliação dos Resultados:
Erro médio absoluto percentual (MAPE – Mean Absolute Percent Error).

48 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Treinamento: 576 padrões Redes MLP x Redes Bayesianas números de neurônios na camada escondida diferentes métodos de seleção de variáveis média aritmética x média ponderada Validação: 384 padrões Teste: 851 padrões Mean Absolute Percent Error (MAPE) Inferência por Redes Neurais Bayesianas 48

49 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Redes Neurais MLP com Média Aritmética Método de Seleção # Entradas # Neurônios MAPE treino Validação Todas Inferência por Redes Neurais Bayesianas 49

50 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Redes Neurais Bayesianas com Média Aritmética Método de Seleção # Entradas # Neurônios MAPE treino Validação Todas Variáveis Inferência por Redes Neurais Bayesianas 50

51 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Redes Neurais MLP com Média Ponderada Método de Seleção # Entradas # Neurônios MAPE treino Validação Todas Inferência por Redes Neurais Bayesianas 51

52 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Redes Neurais Bayesianas com Média Ponderada Método de Seleção # Entradas # Neurônios MAPE treino Validação Todas Inferência por Redes Neurais Bayesianas 52

53 Inferência por Redes Neurais Bayesianas
Testes Avaliação dos Resultados: Validação Teste Os maiores erros são negativos, correspondendo a grandes decrementos na qualidade do produto. Devido à dependência direcional do processo de destilação. Inferência por Redes Neurais Bayesianas 53


Carregar ppt "BUSINESS INTELLIGENCE MASTER"

Apresentações semelhantes


Anúncios Google