PREDIÇÃO DATA MINING AULA 13 SANDRA DE AMO Pós-graduação em Ciência da Computação - UFU
PREDIÇÃO O que é Exemplos Classificação: prevê o valor de um atributo classe Predição: prevê o valor de um atributo qualquer, contínuo Exemplos Predizer o salário dos mestres formados no PPG-CC após 10 anos de experiência. Predizer o potencial de venda de um produto dado o seu preço. Pós-graduação em Ciência da Computação - UFU
TAREFA DE PREDIÇÃO Dados: Conjunto de vetores de n+1 variáveis (x1,x2,…,xn,y) dois tipos de variáveis x1, x2, ..., xn = variáveis explicativas Y = resposta (variável cujo valor se quer predizer) Objetivo: “descobrir” uma função “preditora” f: Rn R Pós-graduação em Ciência da Computação - UFU
Métodos Regressão Tipos de Regressão Outros métodos: Metodologia estatística desenvolvida pelo matemático Sir Frances Galton (1822-1911) Tipos de Regressão Regressão linear Regressão não linear (polinomial, exponencial) Outros métodos: Classificador KNN pode ser utilizado como preditor Redes Neurais podem ser adaptadas para atuarem como preditores Pós-graduação em Ciência da Computação - UFU
MÉTODO DA REGRESSÃO LINEAR SIMPLES Problema (no caso de duas variáveis) Input: banco de dados de m amostras completas (X,Y) com valores contínuos. Output: Reta F(x) = w1 x + w0 que minimiza o erro quadrático SSE SSE = Pós-graduação em Ciência da Computação - UFU m Σ (yi – f(xi)) 2 i=1
REGRESSÃO LINEAR Y = w0 + w1 X w0 = ? w1 = ? Y’ X’ Pós-graduação em Ciência da Computação - UFU X’
REGRESSÃO LINEAR FUNÇÃO PREDITORA = RETA Σ (xi – x) i = 1 m 2 w0 = y – w1 x w1 = Σ (xi – x)(yi – y) F(x) = w1 X + w0 Pós-graduação em Ciência da Computação - UFU x = média dos valores de x1, ... ,xm y = média dos valores de y1, ... ,ym Equação da reta “preditora” y = w0 + w1x
Exemplo Predizer o salário de um mestre formado no PPG-CC X = anos de experiência y = salário (em R$ 100) 3 8 9 13 6 11 21 1 16 30 57 64 72 36 43 59 90 20 83 Pós-graduação em Ciência da Computação - UFU Predizer o salário de um mestre formado no PPG-CC após 10 anos de experiência
Exemplo W1 = (3-9.1)(30-55.4) + (8 – 9.1)(57-55.4) +... + (16-9.1)(83-55.4) = 3.5 (3 – 9.1)2 + (8 -9.1)2 + (16 – 9.1)2 W0 = 55.4 – (3.5)(9.1) = 23.6 Equação da reta Y = 23.6 + 3.5 X Pós-graduação em Ciência da Computação - UFU Usando esta equação, concluimos que depois de 10 anos de experiência, a previsão de salário é de Y = 23.6 + 3.5*10 = 58.6 ou R$ 5860,00
GENERALIZAÇÃO Regressão com múltiplas variáveis Regressão polinomial Y = w0 + w1x1 + w2x2 Regressão polinomial Y = w0 + w1x + w2x + w3x x = x1, x = x2, x = x3 Reduz-se a regressão linear a várias variáveis 2 Pós-graduação em Ciência da Computação - UFU 3 2 3
Acurácia de Preditores Seja D um banco de dados de testes da forma (X1,y1), ..., (Xn, yn). y’1, y’2, ..., y’n : valores preditos Média do erro absoluto = Σ |yi – y’i| Média do erro quadrático= Σ |yi – y’i|2 Erro absoluto = Σ |yi – y’i| Erro quadrático = Σ |yi – y’i|2 n Pós-graduação em Ciência da Computação - UFU n