A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

R BÁSICO PARA D ATA M INING Diego Cesar F. de Queiroz - dcfq.

Apresentações semelhantes


Apresentação em tema: "R BÁSICO PARA D ATA M INING Diego Cesar F. de Queiroz - dcfq."— Transcrição da apresentação:

1 R BÁSICO PARA D ATA M INING Diego Cesar F. de Queiroz - dcfq

2 I NTRODUÇÃO AO R R é um linguagem (ambiente) de programação para computação estatística e gráfica Baseada na linguagem S (S-Plus) O ambiente R é flexível Pode ser estendido através de pacotes Open source e gratuito

3 I NTRODUÇÃO AO R Homepage do projeto http://cran.r-project.org/ O R é atualizado pelo menos a cada 6 meses R version 2.9.0 has been released on 2009-04-17. Usar http://www.rseek.org/ ao invés do google para buscar coisas relacionadas ao R.http://www.rseek.org/

4 O BSERVAÇÕES Dados são armazenados no “R” como um vetor a=4 a[1] O índice da primeira posição do vetor é sempre 1 Comentários devem ser precedidos por ‘#’ A função c() serve para concatenar em forma vetorial. vetor <- c(1,2,3,4,5,6)

5 O BSERVAÇÕES Para sair >q () Para obter ajuda sobre um comando >help ( ) Se não sabe o nome do comando completo >help.search (“ ”) >apropos(“parte do nome do comando”)

6 E NTRADA E S AÍDA – READ. TABLE O comando setwd ajusta o diretório de trabalho setwd(“c:/temp”) Para ler arquivos com nomes de colunas na primeira linha, use variavel <- read.table (“filename.ext”, header=TRUE) Para obter os vetores de cada coluna rotulada variavel$nomedacoluna

7 E NTRADA E S AÍDA – SCAN O comando setwd ajusta o diretório de trabalho setwd(“c:/temp”) Para ler arquivos com nomes de colunas na primeira linha, use variavel <- scan (“datafile2.dat”, what=list (x=0,y=0)) Para obter os vetores de cada coluna rotulada variavel$x variavel$y

8 E NTRADA E S AÍDA – READ. CSV Para ler arquivos separados por vírgula ou ponto e vírgula, use variavel <- read.csv(“filename.csv", sep=";", dec=",",header=FALSE) Para obter os vetores variavel$x variavel$y

9 E NTRADA E SAÍDA – EDIT () Por fim, para digitar os dados em formato de tabela pode-se utilizar o comando edit() variavel <- edit(data.frame())

10 E NTRADA E S AÍDA WRITE. TABLE () E WRITE. CSV () Para salvar um objeto do R podemos utilizar o write.table ou write.csv write.table(objectname, file =“filename.ext”, sep=“,”) write.csv(objectname, file =“filename.ext”)

11 M ATRIZES Para definir um conjunto de números como uma matriz utilizamos a função matrix: m <- matrix(c(1,2,3,11,12,13), nrow = 2, ncol=3, byrow=TRUE)

12 O PERAÇÕES MATEMÁTICAS entre matrizes e números: se x é uma matriz, temos: soma: x + 2 subtração: x - 2 produto: x * 2 divisão: x / 2 potência: x ^ 2 divisão inteira: x % / % 2 mod: x % 2

13 O PERAÇÕES MATEMÁTICAS entre matrizes: se x e y são matrizes, temos: soma: x + y subtração: x - y produto: x %*% y

14 O PERADORES LÓGICOS maior que: >, >= menor que: <, <= igual a: == diferente de: != para expressões: and: & or: | not: !

15 A LGUMAS FUNÇÕES ÚTEIS min() max() sum() mean() median() sd() cor() var() cov() hist() cbind() rbind()

16 F UNÇÕES DE PLOTAGEM – PLOT () A função plot é a função padrão de desenho no R, todas as outras funções de desenho a utilizam como base plot(c(1:9),c(1:9), xlab=“Eixo x”, ylab=“Eixo y”) Existem algumas variações utilizando o parâmetro ‘type’, ex: type=‘l’

17 F UNÇÕES DE PLOTAGEM – BOXPLOT () A função boxplot cria boxplot de tipos variados, ela pode ser utilizada de maneira singular: boxplot(c(1:9)) Pode-se também desenhar vários boxplots simultaneamente com boxplot(c(1:9),(c(1:9)/10))

18 R BÁSICO PARA D ATA M INING Diego Cesar F. de Queiroz - dcfq


Carregar ppt "R BÁSICO PARA D ATA M INING Diego Cesar F. de Queiroz - dcfq."

Apresentações semelhantes


Anúncios Google