PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Engenharia de.

Slides:



Advertisements
Apresentações semelhantes
Operações sobre o Texto
Advertisements

Engenharia de Software
Banco de Dados I Aula 24.
INTELIGÊNGIA COMPUTACIONAL
Curso: Banco de Dados I Análise de Sistemas PUC Campinas
Introdução à Programação uma Abordagem Funcional Programação I Prof.ª Claudia Boeres CT VII - Sala 32 Departamento de Informática Centro.
Infra-Estrutura de TI: Hardware e Software
Linguagens Formais e Autômatos
Algoritmos e Programação
Um Processo Baseado em MDA para a Especialização de Mecanismos de Persistência Fabio Seixas Marques Seminário LES – 7 de abril de.
Interfaces Conversacionais
Aplicação de XML Web Semântica Tópicos Avançados em Bancos de Dados II
Sistema Web para Departamentos
Lógica de Programação Módulo II
Ontologias para Melhorar Precisão e Cobertura de Buscas na Web
Criando um blog com o wordpress. Criando um blog com o Wordpress Acesse:
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
UMA FERRAMENTA PARA PROJETAR OS PROCESSOS
Interfaces gráficas e Interfaces Web
Integrando Textura e Forma para a Recuperação de Imagens por Conteúdo
Engenharia de Requisitos Requisito – sistema Caso de uso - usuário
Reconhecedor de Conceitos
Reconhecedor de Conceitos
TECNOLOGIA AUTORA: VALDEANE CASSIA E. BEZERRA PROFESSORA DE PORTUGUÊS.
Engenharia de Software
Cursos de Informática - UNATI UNIVERSIDADE ESTADUAL PAULISTA Júlio de Mesquita Filho Faculdade de Filosofia e Ciências – Campus de Marília Universidade.
Professor Fernando Luís
Configuração de manutenção
Prof. Ilaim Costa Jr. Novas Tecnologias Prof. Ilaim Costa Jr.
JAVA: Conceitos Iniciais
Equipe de monitoria Aula prática 1
Introdução à Modelagem de Software
Sistema copa do mundo Date Grupo 3 : Amilton , Ederson
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Engenharia de Computação Integrantes:André Kenji.
Programação Avançada Prof. Natalia Castro Fernandes
Sistemas Operacionais
Programação para estrutura Cliente-Servidor
PETER ANTONY RAUSCH JOYCE MARTINS
INFERÊNCIAS SOBRE OS PERFIS DE VESTIBULANDOS DOS CURSOS DE ENGENHARIA DO CEFET-MG UTILIZANDO A FERRAMENTA WEKA DE DATAMINING Aluna: Lúcia Salomé de Aguilar.
Informática Aplicada à Gestão (2013/14) UBI - Dep. de Informática 1  A página da disciplina já está disponível.  Encontra-se facilmente a partir de:
Ferramenta Case para desenvolvimento do modelo E/R
Projeto de Banco de Dados
Vânia Maria P. Vidal, José Maria Monteiro, Luís Eufrasio T. Neto
Professor: Márcio Amador
Universidade Federal de Santa Catarina Centro de Comunicação e Expressão Pós-Graduação em Estudos da Tradução OS EPISÓDIOS DE CHAVES TRADUZIDOS PARA O.
Curso de Aprendizado Industrial Desenvolvedor WEB
Área de Conhecimento: Engenharias e Computação
Inteligência Artificial Web Semântica
Requisitos de Software
BANNER PROFA. VALÉRIA PASSOS.
Tabela Hash Alunos : Gustavo Jorge Zanin nºUSP
Mas para que serve um analisador sintático? Verificar se a estrutura gramatical do programa está correta Escrito de outra forma: O texto segue as regras.
ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO Departamento de Engenharia de Computação e Sistemas Digitais Implementação de buscas utilizando Linguagem.
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2010 Integrantes: Professor Orientador: Co-orientador:
Linguagem publicitária
Apresentação do Tema do trabalho
Indexação Automática e Etiquetadores parte do discurso (POS tagger)
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Co-orientadores:
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2009 Integrantes: Professor Orientador: Co-orientador:
SISTEMAS DE INFORMAÇÃO
Exercícios Faça um algoritmos para trocar uma lampada queimada.
Avaliação de Interfaces Esta apresentação foi baseada no livro Design de Interação ( Preece, Rogers & Sharp) e no Tutorial sobre o livro “Design e avaliação.
Servindo como “Consultor de Clube” 0. Consultor: 1.
Sistemas de Computação para Telecomunicações Prof. Natalia Castro Fernandes Universidade Federal Fluminense Departamento de Engenharia de Telecomunicações.
COMPILADORES 02 Prof. Marcos. COMPILADORES Do Programa à Execução Computadores das mais variadas arquiteturas têm funcionamento:
Gustavo Comeli, Giullyan Kuntze, Maria Inés Castiñeira Ciência da Computação, Pedra Branca (PMUC) Introdução Um dos indicadores de Qualidade de software.
Levantamento de Requisitos – Simulação do Supermercado
Rhizome. Roteiro Definição Metas Características Arquitetura Tecnologias envolvidas Referências.
COMPILAÇÃO E RECUPERAÇÃO DE INFORMAÇÕES TÉCNICO-CIENTÍFICAS E INDUÇÃO AO CONHECIMENTO DE FORMA ÁGIL NA REDE AGROHIDRO MARIA FERNANDA MOURA 1 ;
Transcrição da apresentação:

PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Engenharia de Computação André Felipe Santos ( ) Celso Vital Crivelaro ( ) Ricardo Luis de Azevedo Rocha ( ) Extração de Informações de Textos Jornalísticos sobre Futebol O objetivo do trabalho é a extração de informações sobre uma partida de futebol como times, jogadores, gols e resultados a partir de textos jornalísticos sobre o tal esporte. Objetivo Material e Método Assim, é armazenada a informação sobre uma estrutura de dados para apresentação sobre um texto que serve para pesquisa e mineração de dados sobre um campeonato ou série de jogos transformando uma informação não-estruturada em uma informação estruturada. Para o uso da extração é usado o framework nltk (Natural Language Toolkit) para Python. Trata-se de um framework bem rico para pesquisa e desenvolvimento de processamento de linguagem natural. Com isso, usaremos o framework Django para o desenvolvimento Web em conjunto com o banco de dados PostreSQL. Para realizar a análise léxica, foi usado POS Tagger Treetagger feito pela Universidade de Stuttgart e treinado com corpus em língua portuguesa. O POS Tagger é um analisador morfossintático usando no console do Linux, fornecendo resultados como classificação de palavras em substantivos, verbos, etc.. Em seguida temos a análise sintática para classificar estruturas de interesse. A abordagem para o processamento de texto possui etapas muito análogas às de um compilador, passando pelas fases de análise léxica, sintática e semântica. Por fim, aplicamos análise semântica obtendo de fato as informações desejadas, que são armazenadas no banco de dados. Com o banco de dados preenchido pela extração de informações, temos todo esse material disponível para exibição ao usuário. A interface do mesmo é através de uma página Web, na qual há uma caixa de texto em que o usuário insere os termos de seu interesse. Como massa de dados a ser tratada, reunimos todas as notícias de resultados do campeonato paulista de Portanto, as entradas esperadas são termos relativos ao mesmo: clubes de primeira divisão deste campeonato. Com uma entrada dada, são processados os termos, identificando quais são, e que tipo de termos é: clubes, resultados, estádios. Com as possíveis combinações, são retornadas as páginas que se acredita ser de interesse do usuário. Pela arquitetura apresentada conseguimos usar ferramentas diferentes para cada fase do processamento lingüístico. Assim, conseguimos fazer um tratamento isolado para a parte Léxica, Sintática e Semântica. Devido a complexidade de uma análise morfo-sintática, conseguimos extrair informações simples, porém, essenciais para as fases seguintes. Resultados Conclusões O projeto apresenta uma forma de transformar um grupo de informações não-estruturadas em informações estruturadas. Para isso foi usado recursos de processamento de linguagem natural, com frameworks específicos. Com essas informações estruturadas podemos fazer buscas elaboradas e também recursos de mineração de dados na busca de padrões. Figura 1 : Arquitetura do extrator de informações Figura 2: Arquitetura Geral do Sistema