Métodos em lingüistica de corpus e processamento da língua natural María Paula Santalla del Río Pablo Gamallo Otero Elaboración do material informático.

Slides:



Advertisements
Apresentações semelhantes
Programação Funcional
Advertisements

Prof.: MSc. Marcelo Machado Fernandes
INTRODUÇÃO AO ESTUDO DA LINGUAGEM E DO DISCURSO
LINGUÍSTICA HISTÓRICA: REVISÃO E APROFUNDAMENTO
Investigação e descrição de C LEs Terminológicas em Português e Italiano: um estudo de caso Ariane Conceição Ribeiro Marques Cláudia Mendonça Scheeren.
To be, or not to be? Patrícia Zanin
Treino de escrita? No computador?
LEITOR Avaliadores SISTEMA HIERÁRQUICO Administrador Editor Gerente Editor Editor Seção Ed.Texto, Ed. Layout Ed.Pro- va AUTOR Instala, informático Customização.
Algoritmos e Estruturas de Dados I
INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO DO PORTO.
Criando corpora pessoais Corpógrafo – presente e futuro
- PROGRAMA DE PORTUGUÊS -
Conhecimento Explícito da Língua (CEL)
Extracção Automática de Ontologias a Partir de Texto
Corpus lingüísticos: proceso de elaboración e extracción automática de información María Paula Santalla del Río Pablo Gamallo Otero Elaboración do material.
Informática Teórica Engenharia da Computação
Recursos de Informática aplicados à formação acadêmica
Cícero Nogueira dos Santos Ruy Luiz Milidiú
DAVIDE BUSCALDI PAULO ROSSO
Linhas de Pesquisas Científicas Desenvolvidas no IFBA
APLICANDO O PROCESSO DIRIGIDO POR RESPONSABILIDADES PARA A CRIAÇÃO DE UM SUBFRAMEWORK PARA VALIDAÇÃO SINTÁTICA DE FÓRMULAS Autores: Rafael Hornung Simone.
MARCAS DA ORALIDADE NA ESCRITA
Abordagem audiolingual
INTRODUÇÃO.
Universidade Federal de Santa Catarina Centro de Comunicação e Expressão Pós-Graduação em Estudos da Tradução OS EPISÓDIOS DE CHAVES TRADUZIDOS PARA O.
Ensinar e aprender em/na rede: criando ambientes de aprendizagem na web Patrícia B. Scherer Bassani.
Introdução a Perl Tema 3B Pablo Gamallo Otero
Extracção Automática de Ontologias
PROGRAMAÇÃO EM SHELL SCRIPT SANDRO LUIZ FREDES MORALES Introdução a Informatica 1 ANÁLISE E DESENVOLVIMENTO DE SISTEMAS 2013.
Elisa Rodrigues (PIBIC) Mauren Cereser (SEAD) Coordenação: Profa. Dra. Sandra Loguercio Profa. Dra. Cleci Bevilacqua (Dept. de Línguas Modernas, IL) Colaboração:
APRESENTAÇÃO TELE-SALA: CAMETÁ ANO: 2007 DANIELA SANTOS FURTADO
Como fazer referências bibliográficas
Método da Gramática – Tradução
Usando Perl para a extracção automática de informação a partir de corpus bruto / cru Tema 4A Pablo Gamallo Otero
Usando Perl para a extracção automática de informação a partir de corpus anotado e organizado em n-gramas Tema 4B Pablo Gamallo Otero
Temas 3, 4 e 5 Pablo Gamallo Otero
A LINGUAGEM JORNALÍSTICA DOS VEÍCULOS DIÁRIO CATARINENSE E HORA DE SANTA CATARINA: UMA ANÁLISE DISCURSIVA DA CONSTRUÇÃO DO SUJEITO-LEITOR. Área de conhecimento.
Replicação Metas Curriculares de Português
Métodos em lingüistica de corpus e processamento da língua natural María Paula Santalla del Río Pablo Gamallo Otero.
Análise de Termos Compostos em Textos Legislativos da Suíça – Alemão e Italiano Alessandra Gusatto e Cristiane Krause Kilian.
Sessão n.º 6 Competência específica: Conhecimento Explícito da Língua.
Indexação Automática e Etiquetadores parte do discurso (POS tagger)
Formatação da Defesa da Monografia Versão de 18/01/10
Geração automática de tesaurus e recuperação de informação Pablo Gamallo GLINt (Gupo de Lingua Natural) FCT, UNL.
Quem Sou Eu? Olá! Sou Profª.: Gleide Castro, ministrante da disciplina Língua Portuguesa/curso de Letras; pós-graduada em Psicopedagogia Clínica e Institucional.
CIED I CONGRESSO INTERNACIONAL DE ESTUDOS DO DISCURSO Grupo de Estudos do Discurso da Universidade de São Paulo Linguística Textual: LINGUÍSTICA TEXTUAL:
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
O corpus COMPARA Ana Frankenberg-Garcia ISLA, Lisboa.
Título do trabalho Autores justificados à esquerda; Especificações.
PCS - Departamento de Engenharia de Computação e Sistemas Digitais Projeto de Formatura – Turmas 2008 Integrantes: Professor Orientador: Engenharia de.
Thesaurus Design (from analised corpora) Pablo Gamallo, Alexandre Agustini, G.P. Lopes GLINt (Gupo de Lingua Natural)
Núcleo de Pesquisas em Informática, Literatura e Linguística Universidade Federal de Santa Catarina Brasil.
Classificação Probabilística com TBL Cícero Nogueira dos Santos Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio Departamento de Informática.
Resolução de Anáforas Pronominais Apresentação da Proposta de Projeto Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática INF.
Linguagem, tecnologias e cidade Biblioteca Virtual das Ciências da Linguagem no Brasil  bvCLB 
CURSO - RECURSOS HUMANOS DISCIPLINA - COMUNICAÇÃO SEMESTRE 1º
Variação Linguística: Dialetos, Registro e Normas Linguística
Lim et al, Supplemental Table S1. Primer list for cloning and semi-quantitative RT-PCR.
Corpus lingüísticos: proceso de elaboración e extracción automática de información María Paula Santalla del Río Pablo Gamallo Otero Elaboración do material.
Indexação automática de documentos utilizando técnicas de mineração de textos Trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
Interpretação Constitucional e Justiça Constitucional Direito Constitucional e Europeu Professor Doutor Nuno Piçarra Maria Beatriz Brito MESTRADO EM DIREITO.
O Gênero e a Argumentação nasTradições Discursivas DLCV – Área de Filologia e Língua Portuguesa Letícia Fernandes de Britto Costa Orientadora: Profª Drª.
Indexação automática de documentos utilizando técnicas de mineração de textos Proposta para trabalho de conclusão de curso Fabio Montefuscolo Rafael Câmara.
ANÁLISE COMPARATIVA DE INTRODUÇÕES DE MONOGRAFIAS NAS ÁREAS DE LÍNGUA E LITERATURA DO CURSO DE LETRAS DA UNISUL: FOCO NO USO DA MODALIDADE (ART. 170).
OS GÊNEROS TEXTUAIS DO CINEMA EM AULAS DE LÍNGUA PORTUGUESA
( do primeiro autor do trabalho)
A INDÚSTRIA SUCROALCOOLEIRA: MAIS QUE UMA IDENTIDADE REGIONAL
Grupo IBEP Educação Grupo editorial 100% brasileiro.
DISEÑO INICIAL DE LA INVESTIGACIÓN
Transcrição da apresentação:

Métodos em lingüistica de corpus e processamento da língua natural María Paula Santalla del Río Pablo Gamallo Otero Elaboración do material informático (CD LIVE): Susana Sotelo Docío

Ferramentas para o processamento da língua natural e para a extracção de informação Pablo Gamallo Otero

Bibliografia Tony Berber Sardinha (2004), Lingüística de Corpus, Editora Manole, Brasil. Marco Baroni (2009), “Distributions in text”. In Anke Lüdeling and Merja Kytö (eds.), Corpus linguistics: An international handbook, Berlin: Mouton de Gruyter. Disponível em: J. Torruella y J. Llisterri (1999): “Diseño de corpus textuales y orales”, en J. M. Blecua et al. (eds.), Filología e informática. Nuevas tecnologías en los estudios filológicos, Barcelona: Editorial Milenio y Universidad Autónoma de Barcelona, págs Disponível em: Pablo Gamallo & Isaac González (2009) "Una gramática de dependencias basada en patrones de etiquetas", Procesamiento del Lenguaje Natural, 43, pp Disponível em:

PLANO DO CURSO 1.Noções básicas de EI 2.Breve introdução a Linux 3.Tokenizadores e concordâncias 3.1. contar tokens e formas, ordenar, comparar textos, riqueza lexical de textos 3.3. Key Word in Context 4.Etiquetadores (PoS tagging) 4.1. Tree-Tagger 4.2. FreeLing 5.Analisadores (parsing) 5.1. DepPattern

OBJECTIVOS  Utilizar ferramentas robustas de processamento de corpus: tokenizadores, etiquetadores, analisadores,...  Extrair informação (contar, ordenar...) do corpus processado