1 MD - junho/2008 HAC Regressão Tarefa preditiva em que as classes são contínuas Objetivo: predizer um valor numérico para a saída: Consumo de um carro em função de suas características Valor de um imóvel em função das características dele e do bairro
2 MD - junho/2008 HAC Regressão Encontrar uma relação entre um conjunto de atributos de entrada e um atributo-meta contínuo da seguinte forma: y = f(x1,x2,...,xd) potência peso aceleração consumo
3 MD - junho/2008 HAC Conjunto de dados para classificação x x x x x x x x x x o o o o o o o o o o o o o Renda Dívida Dados no formato atributo-valor: Renda Dívida Status
4 MD - junho/2008 HAC Formas de representação do classificador que realiza regressão: Árvore de regressão Regras de regressão
5 MD - junho/2008 HAC Árvores de regressão As árvores são compostas por dois tipos de nós: – os nós internos da árvore: cada um desses nós corresponde a um teste feito em um dos atributos de entrada do conjunto de treinamento, e – os nós-folha, onde são feitas as predições do atributo- meta. Os nós-folha de uma árvore de regressão possuem uma função matemática (que no caso mais simples pode ser a média dos valores que caem em cada nó- folha) para predizer o atributo-meta
6 MD - junho/2008 HAC Exemplo Definição da área Domínio: carros Os dados relacionam alguns atributos de carros Definição do problema encontrar um padrão que permita predizer o consumo de um carro em milhas por galão de combustível, a partir de outros atributos do carro
7 MD - junho/2008 HAC potência peso aceleração consumo
8 MD - junho/2008 HAC Exemplo exemplos: 1, 2,,,,,, 20 atributos: potência, peso, aceleração atributo meta: consumo
9 MD - junho/2008 HAC Aplicação do algoritmo de regressão atributo selecionado: potência 96 > 96 nesse ponto é encontrada uma expressão que calcula o valor do consumo Exemplo carros
10 MD - junho/2008 HAC Árvore com equações linerares nas folhas LM1 consumo = * potencia * peso LM2 consumo = * potencia * peso
11 MD - junho/2008 HAC Árvore de regressão potencia <= 96 : | peso <= 2251 : LM1 (2/12.257%) | peso > 2251 : LM2 (3/30.575%) potencia > 96 : | potencia <= : | | potencia <= : | | | potencia <= 135 : LM3 (2/0%) | | | potencia > 135 : | | | | peso <= 3529 : LM4 (3/20.016%) | | | | peso > 3529 : LM5 (2/12.257%) | | potencia > : LM6 (4/0%) | potencia > : LM7 (4/0%)
12 MD - junho/2008 HAC Expressões lineares LM num: 1 consumo = * potencia * peso LM num: 2 consumo = * potencia * peso LM num: 3 consumo = * potencia * peso LM num: 4 consumo = * potencia * peso LM num: 5 consumo = * potencia * peso LM num: 6 consumo = * potencia * peso LM num: 7 consumo = * potencia * peso
13 MD - junho/2008 HAC Árvore com valores constantes nas folhas (selecionando opção de poda da árvore) LM1 consumo = 19.2 LM2 consumo =
14 MD - junho/2008 HAC Regras de Regressão Uma regra na FNC possui a seguinte forma: – if then Regra 1: potencia <= 96 : LM1 (5/29.452%) Regra 2: potencia > 96 : LM2 (15/20.855%) LM num: 1 consumo = * potencia * peso LM num: 2 consumo = * potencia * peso
15 MD - junho/2008 HAC Erro e Precisão Para problemas de regressão o erro pode ser estimado pelo cálculo da distância entre o valor real e o estimado Erro médio quadrático (MSE) mse(h) = 1/n (y i h(x i )) 2 Distância absoluta média (MAD) mad(h) = 1/n abs((y i h(x i ))
16 MD - junho/2008 HAC Cálculo de erro e precisão potência peso aceleração consumo