A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Análise das estatísticas dos times e jogadores em Life Jeferson Valadares Idevan Gonçalves Freire Júnior Reginaldo Valadares.

Apresentações semelhantes


Apresentação em tema: "Análise das estatísticas dos times e jogadores em Life Jeferson Valadares Idevan Gonçalves Freire Júnior Reginaldo Valadares."— Transcrição da apresentação:

1 Análise das estatísticas dos times e jogadores em Life Jeferson Valadares Idevan Gonçalves Freire Júnior Reginaldo Valadares

2 Objetivos - Motivação * Extrair estatísticas a partir de páginas na Web * Carrega-las como fatos em um BDD * Completa-las com estatísticas derivadas * Pre-processamento para mineração * Estudo de caso: derivar a partir das estatísticas elementares padrões de basquete (ex, pts, reb, ast etc.) estatísticas compostas medindo o desempenho global dos jogadores e dos times Tendex básico = ( pts + reb + ast + stl + blk - (FGA-FGM) - (FTA-FTM) -TO)) / game_num Tendex normalizados por vários fatores

3 Normalizações de Tendex * Tendex básico de time * Tendex de jogador normalizado por ritmo de jogo * Tendex de jogador normalizado por ritmo de jogo e minutos jogados

4 Problemas encontrados durante a implementação * Florid é uma ferramenta limitada: Falta conversão de strings para inteiros Falta cálculo com números reais Falta regras genéricas para decompor strings em substrings t predicado built-in substring pode ser chamado apenas com 2 variáveis instanciadas Expressões regulares para fazer parsing não permitem analisar padrões sensíveis ao contexto * Solução: pipeline de FLORID com LIFE

5 Criação de BDs dos times * Extrair estruturas das home-pages: teamstatsoff:page = "http://www.di.ufpe.br/~streak/espn.sportszone.com/nba/ statistics/1998/teamstatoff.html". teamstatsdef:page = "http://www.di.ufpe.br/~streak/espn.sportszone.com/nba/ statistics/1998/teamstatdef.html". * Modelar a Web page::url. X.get[] :- X:page.

6 Criação de BDs dos times * Criando os objetos (times) atl:time[nome->"Atlanta"]. bos:time[nome->"Boston"].... was:time[nome->"Washington"]. * Buscando as tabelas T:tb :- match(teamstatsoff.get,".\(.*\n\)* ","",_tmp), match(_tmp,"\(.*[0-9][0-9].*\)","",T). * Exemplo Team G Fgm-Fga PCT 3pm-3pa PCT Ftm-Fta PCT AVG LA Lakers Minnesota

7 Criação de BDs dos times Carregando a base de dados Time:time[ast->T] :- _tmp:tb, strcat("\(.*", Time.nome, Strtmp), strcat(Strtmp, "\)[ ]*[0-9]*-[0-9]*[ ]*\([0-9]*\)[ ]*\([0- 9]*\)[ ]*\([0-9]*\)[ ]*\([0-9]*\)[ ]*\([0-9]*\)\(.*\)", Str),match(_tmp, Str, "\3", T). * Analogamente para pts,reb, blk, fga, fgm, fta, ftm, fto

8 Demo ao vivo Answer to query : ?- TIME:time[nome -> NOME; fgm -> FGM; fga -> FGA; ftm -> FTM; fta -> FTA; pts -> PTS]. TIME/atl PTS/"95.8" FTA/"2312" FTM/"1749" FGA/"6352" FGM/"2887" NOME/"Atlanta" TIME/bos PTS/"95.9" FTA/"1964" FTM/"1425" FGA/"6924" FGM/"3012" NOME/"Boston... TIME/was PTS/"97.2" FTA/"2156" FTM/"1489" FGA/"6811" FGM/"3080" NOME/"Washington"

9 Criação de BDs dos jogadores * Criando os objetos (times) atl:time[nome->"Atlanta"]. bos:time[nome->"Boston"].... was:time[nome->"Washington"]. * Buscando as home-pages: atl[webpage -> "http://www.di.ufpe.br/~streak/espn.sportszone.com/nba/ teamstats/atl.html". atl.webpage:url.

10 Criação de BDs dos jogadores * Buscando as tabelas T:tb :- match(atl.webpage.get,"\n \(.*\n\)* ","", T). U:tb2:- match(T:tb, "\(.*\n\)*", "", U). V:tb3 :- match(U:tb2,"\([A-Z][a-z]* [a-zA-Z]*\) *\([0-9]*\)[---]\([0-9]*\)\(.*\)","",V). V:tb4 :- match(U:tb2,"\([A-Z][a-z']* [a-zA-Z']*\) *\([0-9][0-9]?\) *.*","",V). * Exemplo: Rebounds G Min PPG RPG APG Off- Def- Tot AST Stl BLK To PF Shaquille Oneal Eddie Jones Kobe Bryant

11 Criação de BDs dos jogadores Carregando a base de dados Time[jogador ->> {X}; -> Y] :- _T1:tb3, _T2:tb4, Time:time, match(_T1:tb3,"\([A-Z][a-z]* [a-zA-Z]*\) *\([0-9][0- 9]*\).\([0-9][0-9]*\)","\1",X), match(X,"\([A-Z][a-zA-Z]*\) *\([a-zA-Z]*\)","\1,X1), strcat(X1,".*",X3), match(X,"\([A-Z][a-zA-Z]*\) *\([a-zA-Z]*\)","\2",X2), strcat(X2,".*",X4), strcat(X3,X4,X5), match(_T2,X5,"",Y1), match(Y1,"[a-zA-Z'] [a-zA-Z]* *\([0-9][0-9]*\) *\([0- 9][0-9]*\) *\([0-9][0-9]*.[0-9]\) *\([0-9][0-9]*.[0- 9]\) *\([0-9][0-9]*.[0-9]\)","\1",Y).

12 Demo ao vivo Answer to query : ?- -> NOME; -> FGM; -> FGA; -> FTM; -> FTA; -> PTS].... Time/van X/"Reeves " PTS/"1209" FTA/"316" FTM/"223" FGA/"942" FGM/"493" NOME/"Reeves "...

13 Leitura de arquivos em Life * Arquivo de entrada (nba1) no formato: atl:time[nome -> "Atlanta"; fgm -> "2887"; fga -> "6352"; ftm -> "1749]. bos:time[nome -> "Boston"; fgm -> "3012"; fga -> "6924"; ftm -> "1425]. * Primeiro passo do programa: (troca de caracteres) clear1 :-X=system("cat nba1 | tr \\- \\= | tr '\[' '\(' | tr '\]' '\)' | tr '\;' '\,' > nba1x"). * Arquivo resultado (nba1x): atl:time(nome => "Atlanta", fgm => "2887", fga => "6352", ftm => "1749). bos:time(nome => "Boston", fgm => "3012", fga => "6924", ftm => "1425).

14 Transformando o arquivo de entrada num conjunto de declarações * Ler o arquivo resultado linha por linha * Filtrar os elementos indesejados da linha * Escrever linha no arquivo nba1y * Dados de entrada já podem ser lidos (load) e entendidos pelo Life * Calcular Tendex de cada time * Mostrar a lista em ordem decrescente

15 Código - proc_file proc_file :- open_in(nba1x, In), open_out(nba1y, Out), repeat, get_line(Line), ( Line = end_of_file, close(In), close(Out), ! ; (( substr(Line,4,1)=":", Line1 <- filter(Line), write(substr(Line1,5,strlen(Line1)-4)),nl)), fail ).

16 get_line(Line) :- get(Char),get_rest(Char,"", Line). get_rest(Char,Line,R):- ( Char = end_of_file, nl, R <- Char, ! ; Char = 10, R=Line, ! ; Line1 = strcon(Line,chr(Char)), get(Char1), get_rest(Char1,Line1,R)). Código - get_line

17 filter("") -> "". filter(S) -> R | H = hds(S), T = tls(S), H1 = hds(T), (( digit(H1), asc(H ) = 34, R=filter(T), ! ; digit(H), asc(H1) = 34, R=strcon(H,filter(tls(T))), ! ; R=strcon(H,filter(T)), ! )). Resultado da aplicação de filter(S): atl:time(nome => "Atlanta", fgm => "2887", fga => "6352", ftm => "1749). time(nome => "Atlanta", fgm => 2887, fga => 6352, ftm => 1749). Código - filter(S)

18 dynamic(timex)? toTendex :- T = time, T, T =time(fga=>FGA, reb=>REB, TENDEX = T.pts+T1.reb+T1.ast+T1.stl+T1.blk-(T.fga-T.fgm)-(T.fta-T.ftm)- T1.to, assert(timex(nome=>N, tendex => TENDEX)), fail. toTendex. Cálculo do Tendex dos times

19 import("lists")? sort(L,F) -> gen_quicksort (L, order => -> X>Y. bagTendex(B) :- X=timex, B=bagof(X,X). geraTendex :- bagTendex(X), X4=sort(X,sort_func), write("Lista por ordem decrescente de Tendex"), nl, nl, wl(X4),nl. wl([]) :- !. wl([X|Xs]) :- write(X),nl,wl(Xs).. Ordenação dos times

20 >teams? Lista em ordem decrescente: team(nome => Utah,tendex => 1618) team(nome => Phoenix,tendex => ) team(nome => LA Lakers,tendex => ) team(nome => San Antonio,tendex => ) team(nome => Chicago,tendex => ) team(nome => Minnesota,tendex => ) team(nome => Seattle,tendex => ) team(nome => Indiana,tendex => 1240) Execução


Carregar ppt "Análise das estatísticas dos times e jogadores em Life Jeferson Valadares Idevan Gonçalves Freire Júnior Reginaldo Valadares."

Apresentações semelhantes


Anúncios Google