O que é o COMPARA? 2007-07-31.

Slides:



Advertisements
Apresentações semelhantes
Promoções na Segurança Social
Advertisements

Procura_PALavras (P_PAL): Um software para avaliação de palavras do Português Europeu Ana Paula Soares, Montserrat Comesaña, José João Almeida, Alberto.
Ana Frankenberg-Garcia
Encontro Ciência em Portugal Ciência 2007 Fundação Calouste Gulbenkian Fundação Calouste Gulbenkian 12 e 13 de Abril de 2007.
Encontro Ciência em Portugal Ciência 2007 Nomes e Cores Pessoa e Complexidade Identitária Projecto financiado pela FCT ( ) Susana Matos Viegas.
Europa: aprender com o Mundo
A FORMAÇÃO DO PROFESSOR PARA A PRÁTICA PEDAGÓGICA DA LITERATURA INFANTIL NOS ANOS INICIAIS DO ENSINO FUNDAMENTAL DA ESCOLA DO CAMPO. Ineis Bernardete.
História e Sociologia da Farmácia
DICIONÁRIOS PARA O FUTURO TRADUTOR Susana de Azeredo (Mestre em Letras pela UFRGS – colaboradora voluntária) Siane Simioni (Bolsista FAPERGS – acadêmica.
Programa de Bolsas de Iniciação Científica Júnior –PIBIC
ARTILHARIA NOME EQUIPE GOLS SÃO CAMILO
Criando corpora pessoais Corpógrafo – presente e futuro
Mesa Redonda Corpora e Ensino
Formandos do 5º ano Formandos do 5º ano
LEÕES DO SUL FUTEBOL CLUBE ORGÃOS SOCIAIS / PERSONALIDADES ELEITAS
PROJETO DE FORMAÇÃO PARA O NOVO PROGRAMA DE PORTUGUÊS DO ENSINO BÁSICO - I Paulo Almeida.
Quadro de Mérito 3ºciclo 2012/2013.
DIPLOMA Certifica-se que o aluno Inês da Silva Monteiro, nº 14, da turma C do sétimo ano, participou no Concurso de Ditado, realizado no dia 25 de Novembro.
Academia Jogapool Associação de Bilhar do Minho Época
II CURSO DE VERÃO EM BIOINFORMÁTICA ESTRUTURAL UFMG
Ç REUNIR-CIP Transporte inter-hospitalar de crianças criticamente doentes Mª Céu Rocha, Francisco Cunha, Dulce Oliveira, João Rosa, Teresa Cunha Mota,
DI-FCT-UNL Departamento de Informática Faculdade de Ciências e Tecnologia Universidade Nova de Lisboa Engenharia Informática DI-FCT-UNL DI-FCT-UNL:
"Os desafios da Gestão e da Qualidade do Ensino Superior nos Países
Reconhecimentos.
Encontro de Antigos alunos Abrantes fecha em 1975 Encontro com antigos alunos – 2010, junho.
Quadro de Mérito Secundário 2012/2013.
As caricaturas de António Na nova estação do metro
Língua Portuguesa – 7º Ano
Como Estruturar Um Trabalho Escolar?
Recursos da Linguateca Diana Santos Porto, 4 de Outubro de 2005.
A EQUIPA O PROTÓTIPO foto ALUNOS E PROFESSORES A ESCOLA ESCALÃO CEFTeam Alunos: Afonso Correia; André Guerreiro; Braulio Martins; Cristiano Coelho; David.
Acadêmicas: Bruna Daniela Kalschne, Francieli Selzler
Universidade Federal de Santa Catarina Centro de Comunicação e Expressão Pós-Graduação em Estudos da Tradução OS EPISÓDIOS DE CHAVES TRADUZIDOS PARA O.
Projecto FEUP Projecto Especial EQUIPA 8 “Simulação de Processos Tecnológicos”
Quis de curiosidades sobre poetas, escritores, músicos e afins.
José Luandino Vieira Luuanda.
II ENCONTRO DE ESCRITORES DE LÍNGUA PORTUGUESA Natal, de 23 a 25 de novembro de 2011.
Literacia da informação
DIA DO DIPLOMA Sessão de entrega dos diplomas e certificados aos alunos que concluíram o ensino secundário no ano lectivo de 2008/ /Set.
Romantismo Prof. Eduardo Silveira.
Como elaborar um trabalho de pesquisa
Organograma Geral Tokio Nissan
UNIVERSIDADE FEDERAL DE VIÇOSA CENTRO DE CIÊNCIAS HUMANAS, LETRAS E ARTES DEPARTAMENTO DE LETRAS Construindo Saberes na Formação Inicial: Envolvimento.
DESAFIO Distinguir os sintagmas preposicionados (PP= Prepositional Phrases) que são complementos de verbos dos que são adjuntos. Ele trabalha em publicidade.
EBI da TORREIRA Cristina Peixinho Nº3 Elisabete Silva Nº6 João Soares Nº8 Joice Pereira Nº11 Disciplina H.G.P Professora da disciplina: Carla Bernardes.
A EQUIPA O PROTÓTIPO ALUNOS E PROFESSORES A ESCOLA ESCALÃO foto “Super Himalayas” Alunos: Ana Pereira, Ana Silva, Andreia Leal, Aníbal silva, Bruno Amorim,
Guião sobre a ida à biblioteca!
Indexação Automática e Etiquetadores parte do discurso (POS tagger)
28/06/2006 pet recebe computação.
O corpus COMPARA Ana Frankenberg-Garcia ISLA, Lisboa.
Engenharia de Computação: Aula da saudade
PLANO NACIONAL/REGIONAL DE LEITURA JORNAL DE PAREDE GRUPO DE RECRUTAMENTO: 300 (PORTUGUÊS) Delegado de Grupo: Professor Domingos Fernandes ESCOLA BÁSICA.
Estilo de Época Moreninha Moreninha, Moreninha Tu és do campo a rainha
Entrando em linha de conta com os utilizadores O exemplo concreto do COMPARA Ana Frankenberg-Garcia.
SEGURANÇA ALIMENTAR E NUTRICIONAL
Uma viagem ao tempo dos castelos
31 DE MARÇO RESIDENCIAL UNIÃO Líderes Endereços Reinaldo Rosana
   Quadro de Mérito Ensino Básico
   Quadro de Mérito Ensino Secundário
Aula 2 :: Pensamento Crítico
Tutorial Organização: Apoio: Prezados,
Desde 1976 o Grupo Desportivo, Recreativo e Cultural Leões do Sul Futebol Clube teve 9 Presidentes de Direcção. Até 1989, os mandatos eram anuais, tendo.
JORNALISMO RECEPÇÃO AOS ALUNOS DO 1º ANO INSTITUTO DE ESTUDOS JORNALÍSTICOS FLUC 22 DE SETEMBRO DE 2008 INSTITUTO DE ESTUDOS JORNALÍSTICOS FLUC 22 DE SETEMBRO.
BREVE HISTÓRIA DO TEATRO
“O PEQUENO PRÍNCIPE” 3º ANO C PROFESSORAS: KARLA CRISTINA COSTA FABIANA FARIA DE OLIVEIRA.
3º Ciclo - 7ºano À Beira do Lago dos Encantos Meneres, Maria Alberta Editora Asa Grau de Dificuldade 1 10 Exemplares História de Uma Gaivota e do Gato.
DIA DA FPCEUP 5 NOVEMBRO 2008 ESTUDANTES GRADUADOS EM 2007/2008 ADOZINDAMONTEIROADRIANAFERREIRAALEXANDRABARREIRAANACARVALHOANABATISTAANANUNESANACUN HAFERREIRAANASANTOSFERREIRAANADIASANAPINHEIROANACOELHOANARAIMUNDOANASANTOSANAALMEID.
Ana Frankenberg-Garcia Linguateca - Fundação para a Computação Científica Nacional (FCCN) Instituto Superior de Línguas e Administração (ISLA) 9 anos de.
Transcrição da apresentação:

O que é o COMPARA? 2007-07-31

Linguateca www.linguateca.pt COMPARA

A nossa grande equipa Coordenadoras científicas Ana Frankenberg-Garcia & Diana Santos Técnicas de investigação Rosário Silva & Susana Inácio

A nossa sala sala 23 S2

O início do projecto (1999-2000) Ana FCT ISLA, Lisboa Universidade de Oxford (Language Centre) Diana Doutoramento na área Projecto Processamento Computacional do Português

Financiamento

Um corpus paralelo bi-direccional O que é o COMPARA? Um corpus paralelo bi-direccional de português e inglês

O que é um corpus? grande software específico critérios definidos em formato digital

COMPARA estrutura COMPARA Traduções PT Traduções EN Originais EN Originais PT Originais EN

PT EN PT1 PT2 EN1 EN2 TO TT

COMPARA 8.2 variantes Reino Unido Portugal EUA Moçambique África do Sul Brasil Angola PORTUGUÊS INGLÊS

COMPARA 8.2 Datas de publicação 2002 1997 1988 1914 1880 1837

COMPARA 8.2 género Literatura publicada outros géneros

COMPARA 8.2 autores Portugueses Camilo Castelo Branco Eça de Queirós José Cardoso Pires José Saramago Jorge de Sena Lídia Jorge Mário de Carvalho Sá Carneiro

COMPARA 8.2 autores Brasileiros Aluísio Azevedo Autran Dourado Chico Buarque Jô Soares José de Alencar Machado de Assis Manuel Antônio de Almeida Marcos Rey Patrícia Melo Paulo Coelho Rubem Fonseca

COMPARA 8.2 autores Angolanos Moçambicanos José Eduardo Agualusa Mia Couto

COMPARA 8.2 autores Britânicos David Lodge Ian McEwan Julian Barnes Joseph Conrad Joanna Trollope Kazuo Ishiguro Lewis Carrol Mary Shelley Oscar Wilde

COMPARA 8.2 autores Americanos Sul-africanos Henry James Edgar Allan Poe Richard Zimler Sul-africanos Nadine Gordimer

COMPARA 8.2 tradutores PT Ana Maria Amador, Ana Falcão Bastos, Ana Luísa Faria, Aníbal Fernandes, Carlos Grifo Babo, Cristina Ferreira de Almeida, Cristina Rodriguez, Eduardo Guerra Carneiro, Fernanda Pinto Rodrigues, Geraldo Galvão Ferraz, Helena Cardoso, Januário Leite, José Viera Lima, J. Teixeira de Aguilar, Lídia Cavalcante-Luther, Lucinda Santos Silva, Luís Lobo, Manuel João Gomes, M. F. Gonçalves de Azevedo, Maria Carlota Pracana, Maria do Carmo Figueira, Mário Martins de Carvalho, Nina Videira, Paula Reis, Yolanda Artiaga,

COMPARA 8.2 tradutores EN Adria Frizzi, Alan Clarke, Alexis Levitin, Alice Clemente, Cliff Landers, David Brookshaw, David Rosenthal, Elizabeth Lowe, Ellen Watson, Helen Caldwell, Giovanni Pontiero, Graeme Mac Nicoll, Gregory Rabassa, Isabel Burton, John Gledson, John Parker, John Byrne, John Vetch, Margaret Jull Costa, Mary Fitton, Natália Costa, Peter Bush, Richard Zenith e Ronald W. Sousa.

Podemos incluir qualquer texto no COMPARA? Critérios específicos originais e traduções publicados inglês traduzido directamente do português e português traduzido directamente do inglês traduções feitas por seres humanos!

COMPARA 8.2 textos 75 traduções 72 originais (excertos)

COMPARA 8.2 dimensão 1,549,551 1,436,493 palavras palavras em em inglês português O maior corpus paralelo editado do mundo

COMPARA disponibilidade acesso gratuito, em rede para investigação e fins educacionais

COMPARA acesso www.linguateca.pt/COMPARA/ COMPARA

“nodded”

Distribuição de “nodded” em texto original e traduzido Inglês original 13.2 /100 K palavras Inglês traduzido do português 3.6 / 100 K palavras

“grande”

Traduções de “grande”

“ponto” “de” “vista”

COMPARA usos e utilizadores Linguístas e engenheiros / PLN tradução automática e outras aplicações Lexicógrafos dicionários bilingues Teóricos da tradução estudos empíricos sobre tradução Professores de tradução exercícios e problemas de tradução

COMPARA usos e utilizadores Professores de línguas exercícios e testes para os alunos Tradutores e estudantes de tradução equivalências linguísticas Estudantes de línguas e qualquer pessoa que utilize o inglês na sua profissão Dicionário/gramática bilingue com muitos extras Últimos dados: + 9000 pesquisas por mês

Vantagens na utilização de corpora Resultados empíricos Possível analisar uma quantidade enorme de textos Análises sistemáticas Resultados quantificáveis

© Por trás disto tudo... Autores Herdeiros Editoras Tradutores

Por trás disto tudo... Não é só digitalizar...

Limpeza do texto digitalizado em bruto pontão O bebé continua à espera junto ao ponão. O fazendeiro volta ao carro, desliga a ignição e afasta‑se a pé na direc­ção de onde veio ao volante do automóvel. Sai da estrada e mete pelo veld, saltando a donga seca para aterrar, com um baque elástico, nos cosmos mortos e no capim que a ladeavam no Verão. As solas grossas de borracha, sobre o solo duro, raspam as escovas gastas da erva morta cortada rente. Dirige‑se para o aglomerado das casas, que fica io junto ao cercado junto ao cercado

Inserção de etiquetas semânticas EBJB1.pt ele revelou-me o seu interesse por Gosse <tnote> Edmund William Gosse (1849-1928), crítico inglês </tnote> e pela sociedade literária inglesa dos finais do século passado. EBDL2T1.en When we sat on the sofa together to watch <title>News at Ten</title>

Inserção de etiquetas semânticas EBDL1T1.pt passou-me uma receita de <named> Valium </named> EBJB1.en the white bear, <foreign> thalassarctos maritimus </foreign>, is the aristocrat of bears... EBDL1T1.pt acaba por se esquecer de ter medo, até que acaba por verificar que não há <emph> de que </emph> ter medo.

Alinhamento por parágrafo original tradução

Alinhamento por frase Separação de frases 2. Alinhamento automático 3. Revisão manual do alinhamento

F F F F2 F F½ F Ø F F(+F) Revisão manual do alinhamento Original 1 unidade de alinhamento = 1 frase do texto original Original Tradução F F F F2 F F½ F Ø F F(+F)

Único!

Introdução de Anotação Gramatical 1. português 2. inglês Mas o que é anotação gramatical?

Anotação Gramatical Permite Pesquisar palavras flexionadas Refinar pesquisas com palavras ambíguas Pesquisar colocações E muito mais

Palavras flexionadas [lema=“ajudar”]

Palavras ambíguas [word=“gosto” & pos=“N”]

Palavras ambíguas [word=“gosto” & pos=“V”]

Colocações [pos="V.*"] "silêncio"

anotação automática não é 100% fiável! Revisão manual em curso

O futuro Controle de qualidade Terminar revisão da anotação gramatical PT Iniciar anotação gramatical EN Autorizações menos restritivas Interface mais amigável Melhor usabilidade Expansão Mais textos Mais gêneros Mais línguas?

COMPARA acesso www.linguateca.pt/COMPARA/ COMPARA