A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Encontro do Segundo HAREM

Apresentações semelhantes


Apresentação em tema: "Encontro do Segundo HAREM"— Transcrição da apresentação:

1 Encontro do Segundo HAREM
Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

2 Desafios HAREM clássico (seguindo genericamente o modelo de classificação proposto no Primeiro HAREM, mas refinando algumas distinções, quer ao nível da segmentação das EM quer da sua classificação) Pista para identificação e normalização de expressões temporais (Hagège et al., 2008) Pista ReRelEM, para a identificação de relações semânticas entre EM

3 Calendário do HAREM (2007) Data-limite para registo no HAREM
Versão preliminar das directivas do Segundo HAREM Primeira chamada para o Segundo HAREM Data-limite para discussão sobre os moldes do Segundo HAREM

4 Encontro do Segundo HAREM
Calendário do HAREM (2008) Primeira versão da mini-CD do TEMPO e a versão final CD Primeira versão da mini-CD do ReRelEM Versão final da mini-CD do TEMPO Resultados preliminares do HAREM clássico Resultados preliminares da pista do TEMPO Directivas finais e material de treino Primeira versão da Colecção Dourada Colecção HAREM Resultados da pista ReRelEM Relatórios de desempenho Encontro do Segundo HAREM Versão final da mini-CD do ReRelEM

5 Caracterização do HAREM
EM em contexto Regressou então a <EM ID="hub " CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Portugal</EM>, onde iniciou meteórica carreira na experimentação de novas formas de expressão O acordo político quanto à revisão foi obtido durante a <EM ID="aa " CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Presidência Alemã</EM> , tendo cabido a <EM ID="aa " CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Portugal</EM> concluir o processo de revisão. Este debate passou completamente ao lado de <EM ID="H2-dftre765-8" CATEG="PESSOA" TIPO="POVO">Portugal</EM> «o problema do <EM ID="hub “ CATEG="ORGANIZACAO|ABSTRACCAO" TIPO="INSTITUICAO|DISCIPLINA">PSD</EM> é começar a ter só um <EM ID="hub " CATEG="ABSTRACCAO" TIPO="IDEIA">Portugal</EM> ou dois dentro de si» <EM ID=“Ex-1GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO">Portugal</EM> perdeu com a <EM ID=“Ex-2GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO“>Suíça</EM> por <EM ID=“Ex-3GM" CATEG=“VALOR" TIPO=“CLASSIFICACAO">2-0</EM>

6 Caracterização do HAREM
EM vagas Pela mão do <EM ID="aa " CATEG="PESSOA" TIPO="INDIVIDUAL">ministro Freitas do Amaral</EM>, e sem necessidade alguma, <EM ID="aa " CATEG="ORGANIZACAO|PESSOA" TIPO="ADMINISTRACAO|POVO">Portugal</EM> foi enxovalhado, coberto de vergonha e de cobardia, por um dos mais tristes textos políticos que já alguém escreveu. <EM ID="hub " CATEG="VALOR" TIPO="QUANTIDADE">Mais de 32 mil</EM> pessoas poderiam morrer se uma pandemia de gripe humana de origem aviária atingisse <EM ID="hub " CATEG="PESSOA|LOCAL" TIPO="POVO|HUMANO" SUBTIPO="|PAIS">Portugal</EM> os dois reinos católicos, <EM ID="aa " CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa " CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa " CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos do <EM ID="aa " CATEG="LOCAL|LOCAL" TIPO="FISICO|HUMANO" SUBTIPO="REGIAO|DIVISAO">Novo Mundo</EM>

7 Caracterização do HAREM
Análises alternativas (ALT) Ambiguidade estrutural: aproximava a <ALT> <EM ID="H2-dftre " CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja de Inglaterra</EM> | <EM ID="H2-dftre aa" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja</EM> de <EM ID="H2-dftre765-16" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Inglaterra</EM> </ALT> do calvinismo. Possibilidade de uma expressão poder ser reconhecida como EM, ou não: <EM ID="aa " CATEG="PESSOA|ORGANIZACAO“ TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa " CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa " CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos;

8 Novidades no Segundo HAREM
Uso extensivo de ALT para representação sistemática da estrutura interna das EM constituídas por outras EM <ALT> <EM ID="aa " CATEG="PESSOA" TIPO="CARGO">presidente da Câmara de Nova Iorque</EM> | presidente da   <EM ID="aa " CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara de Nova Iorque</EM>   <EM ID="aa aa" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara</EM> de <EM ID="aa " CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="DIVISAO">Nova Iorque</EM> </ALT>

9 Novidades no Segundo HAREM
ALT sistematicamente aplicados CATEG ESTRUTURA EXEMPLO PESSOA PESSOA de LOCAL PESSOA de ORGANIZACAO PESSOA de ORG|LOCAL PESSOA de PESSOA Santo António de Lisboa Presidente do Parlamento Europeu Presidente dos Estados Unidos FCP de José Mourinho ORGANIZACAO ORG de LOCAL ORG de ORG Associação Académica de Coimbra Conselho da UE LOCAL LOCAL de LOCAL LOCAL de ORGANIZACAO Teatro Scala de Milão Centro de Eventos da Fiergs OBRA OBRA de PESSOA OBRA|LOCAL de LOCAL Sagrada Família de Gaudí Mosteiro de Santa Clara-a-Velha ACONTECIMENTO ACONT de LOCAL ACONT de TEMPO Jogos Olímpicos de Barcelona Volta a Espanha de 1985 ABSTRACCAO ABSTRACCAO de LOCAL Blues do Delta COISA COISA de ORGANIZACAO iPhone da Apple

10 Novidades no Segundo HAREM
Não reconhecimento de certas palavras em maiúsculas como EM Quando ocorrem no âmbito de uma unidade lexical composta que não constitui, ela própria, uma EM pastéis de Belém; amêijoas à Bulhão Pato Se os restantes constituintes (grafados em minúscula) dessa unidade lexical integrarem a lista das minúsculas permitidas no âmbito desta avaliação, toda a unidade lexical deverá ser reconhecida como EM <EM ID="ric " CATEG="ABSTRACCAO“ TIPO="ESTADO">doença de Chagas</EM> Criar uma animação que mostre as diferenças de identificação/classificação destas expressões nas duas avaliações.

11 Novidades no Segundo HAREM
Desaparecimento de algumas EM estruturalmente complexas Moradas (anterior LOCAL CORREIO) Primeiro HAREM: <EM ID=“PH1” CATEG=“LOCAL” TIPO="CORREIO">Rua Augusta, nº 5 , Lisboa</EM> Segundo HAREM: <EM ID=“SH1” CATEG=“LOCAL” TIPO=“ADMINISTRATIVO“ SUBTIPO=“RUA”> Rua Augusta</EM>, nº 5, <EM ID=“SH2” CATEG=“LOCAL” TIPO=“ADMINISTRATIVO“ SUBTIPO=“DIVISAO”>Lisboa</EM>

12 Novidades no Segundo HAREM
Desaparecimento de algumas EM estruturalmente complexas Moradas (anterior LOCAL CORREIO) Referências bibliográficas (anterior OBRA PUBLICACAO) Primeiro HAREM: Segundo <EM ID="ric " CATEG=“OBRA“ TIPO=“PUBLICACAO"> Calvino 1990 : 121</EM>), Segundo HAREM: Segundo <EM ID="ric " CATEG="PESSOA“ TIPO="INDIVIDUAL">Calvino</EM> ( <EM ID="ric " CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">1990</EM> : 121),

13 CATEGORIA TIPO SUBTIPO X ESCOLA, OBRA, PLANO X SUB X PERIODO, CICLICO
ABSTRACCAO ESTADO, DISCIPLINA, IDEIA, NOME OUTRO ACONTECIMENTO EFEMERIDE, EVENTO, ORGANIZADO COISA CLASSE, MEMBROCLASSE, OBJECTO SUBSTANCIA, OUTRO LOCAL FISICO HUMANO VIRTUAL AGUACURSO, AGUAMASSA, ILHA, PLANETA, REGIAO, RELEVO, OUTRO CONSTRUCAO, DIVISAO, PAIS, REGIAO, RUA, OUTRO COMSOCIAL, OBRA, SITIO, OUTRO OBRA ARTE, PLANO, REPRODUZIDA, OUTRO ORGANIZACAO ADMINISTRACAO, EMPRESA, INSTITUICAO, OUTRO PESSOA CARGO, GRUPOCARGO, GRUPOIND, GRUPOMEMBRO, INDIVIDUAL, MEMBRO, POVO, OUTRO TEMPO DURACAO, FREQUENCIA, GENERICO TEMPO_CALEND DATA, HORA, INTERVALO, OUTRO VALOR CLASSIFICACAO, MOEDA, QUANTIDADE, OUTRO X ESCOLA, OBRA, PLANO X SUB Marcar as EMs q foram pedidas pelos participantes X PERIODO, CICLICO X VARIADO

14 Colecção HAREM DOCS: 1040 Parágrafos: 15737 Palavras: 670610
Sem ter em conta nem a vagueza nem as análises alternativas (tlz a fig. Tenha de ser modificada) Distribuição dos documentos por género na CD

15 CD em números (1) DOCS: 129 Parágrafos: 2274 Palavras: 147991
Entidades: 7836 Entidades vagas: 633 [52 classes] Sem ter em conta nem a vagueza nem as análises alternativas (tlz a fig. Tenha de ser modificada) Distribuição de categorias

16 CD em números (2) Classes de vagueza (21 mais frequentes)
Sem ter em conta nem a vagueza nem as análises alternativas (tlz a fig. Tenha de ser modificada) Categorias associadas às entidades

17 Processo de anotação da CD
Anotação da CD, usando o Etiquet(h)arem Anotação de cada texto por duas anotadoras, usando o Etiquet(h)arem Comparação automática das anotações, usando o Alinhador Análise e discussão das diferenças encontradas Correcção dos casos triviais Discussão dos casos problemáticos com os restantes membros da organização Revisão da CD Revisão sequencial dos documentos Revisão por categoria Revisão das análises alternativas (ALT)

18 Processo de anotação da CD
Comparação automática das anotações, usando o Alinhador Análise e discussão das diferenças encontradas Validação da sintaxe, usando o validador desenvolvido para o efeito Revisão manual da CD Revisão sequencial dos documentos Revisão por categoria Revisão das análises alternativas (ALT) Anotação de cada texto por duas anotadoras, usando o Etiquet(h)arem Comparação automática das anotações, usando o Alinhador Análise e discussão das diferenças encontradas Correcção dos casos triviais Discussão dos casos problemáticos com os restantes membros da organização Revisão da CD Revisão sequencial dos documentos Revisão por categoria Revisão das análises alternativas (ALT)

19 Avaliação do HAREM clássico
Melhorias em relação ao Primeiro HAREM Contabilização de entidades parcialmente identificadas como incorrectas Possibilidade de avaliação estrita dos ALT Casos conceptualmente distintos, representados de forma diferente: ignorância, certeza de ser diferente, erro Sistematização no tratamento das EM

20 Avaliação da classificação semântica
N = número de diferentes classificações na CD de acordo com o cenário M = número de classificações espúrias enviadas pelo sistema α, β, γ = pesos das categorias (1), tipos (0.5) e subtipos (0.25) (c, t, st)_certo = 1, se estiver certo; caso contrário, (c, t, st)_certo = 0 (c, t, st)_espuria= 1, se for espuria; caso contrário, (c, t, st)_espuria= 0

21 Programas de avaliação do HAREM clássico: entradas
<?xml version="1.0" encoding="ISO " ?> <colHAREM versao="SegundoHarem"> <DOC DOCID="Xyz"> O <ALT> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> | <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> | <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> de <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> </ALT> vai começar no <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM>. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão. </DOC> </colHAREM> CDHAREM.xml <?xml version="1.0" encoding="ISO " ?> <colHAREM versao="CD"> <DOC DOCID="Xyz"> O Tour de <EM ID="Xyz_1" CATEG="LOCAL" TIPO=“FISICO“ SUBTIPO=“REGIAO">França</EM> <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> vai começar no <EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de Fórmula 1. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão. </DOC> </colHAREM> participacao.xml

22 Programas de avaliação do HAREM clássico: Alinhador
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Alinhador Alinhador EMs na CD DOC Xyz <ALT> <ALT1> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT1> <ALT2> <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>] <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT2> <ALT3> <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null] <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>] <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>] <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>] <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null] <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>] EMs na participação

23 Programas de avaliação do HAREM clássico: Avaliador de alinhamentos
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Avaliador de alinhamentos Alinhamentos classificados como: Correctos, Espurios, Em Falta ou Parcialmente Correctos Avaliador de alinhamentos Alinhador DOC Xyz <ALT> <ALT1> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Parcialmente_Correcto_por_Defeito(0.1; 0.9), Parcialmente_Correcto_por_Defeito(0.2; 0.8)] </ALT1> <ALT2> <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Parcialmente_Correcto_por_Defeito( ; )] <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto] </ALT2> <ALT3> <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]::[Em_Falta] <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto] <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]::[Correcto] <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]::[Em_Falta] <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]::[Correcto] EMs parcialmente correctas são removidas na próxima fase EM em falta

24 Tipos de cenário Cenário total: elenco completo de categorias, tipos e subtipos propostos para o Segundo HAREM. Cenário selectivo de avaliação: sub-conjunto de categorias, tipos e subtipos do cenário total que é alvo de avaliação. Cenário selectivo de participação: sub-conjunto de categorias, tipos e subtipos do cenário total que cada participante se propôs a utilizar.

25 Programas de avaliação do HAREM clássico: Véus HAREM
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Véus HAREM Alinhamentos filtrados de acordo com o cenário pretendido Véus (HAREM) Avaliador de alinhamentos Alinhador #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM CATEG="ESPURIO">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Espurio] </ALT1> <ALT2> </ALT2> <ALT3> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] Dentro desta alternativa, a EM é espúria Remoção de alinhamentos parcialmente correctos

26 Programas de avaliação do HAREM clássico: Organizador de ALTs
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Organizador de ALTs Organizador de ALTs Véus (HAREM) Avaliador de alinhamentos Alinhador #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]^1 </ALT1> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] A EM espúria desapareceu porque alinhava correctamente com a alternativa seguinte Peso Remoção de alternativas vazias/duplicadas, surgidas depois da aplicação de véus Remoção de EMs alinhadas mais do que uma vez dentro do mesmo ALT - Atribuição do peso1/total de ALT a cada EM dentro de um ALT

27 Programas de avaliação do HAREM clássico: Avaliador semântico
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Avaliador semântico Avaliador semântico Organizador de ALTs Véus (HAREM) Avaliador de alinhamentos Alinhador Precisão Medida-F Abrangência #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD( ) MaxCSC_S( ) CSC(0.875) PALT(1.0)}] </ALT1> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD( ) MaxCSC_S( ) CSC( )}] Avaliação dos atributos semânticos. Peso ALT Classificação máxima da EM na CD Classificação máxima da EM na participação Classificação efectiva

28 Programas de avaliação do HAREM clássico: Selector de ALTs
CDHAREM.xml participacao.xml Programas de avaliação do HAREM clássico: Selector de ALTs Avaliador semântico Organizador de ALTs Véus (HAREM) Avaliador de alinhamentos Alinhador Selecção da melhor alternativa (melhor medida-F e melhor classificação) Selector de ALTs #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD( ) MaxCSC_S( ) CSC(0.875)}] <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD( ) MaxCSC_S( ) CSC( )}] Ficou a única alternativa que existia

29 Participação no Segundo HAREM
Manifestações de interesse: 22 Sistemas inscritos: 16 Sistemas participantes: 10 Saídas: 27 (máx. 4 por participante)

30 Cenários selectivos de participação
Sistema CEN PES ORG LOC OBR ACO ABS COI TEM VAL Cage2 Sel2 CAT F + H DobrEM Pes PorTexTO Temp Priberam Tot R3M Sel3 REMBRANDT REMMA Sel4 C/T SEI-Geo Sel5 SeRELeP XIP/L2F/XEROX Sel6 NORM confirmar CAT – apenas CATEGORIA C/T – apenas CATEGORIA e TIPO F+H – apenas locais FISICOs e HUMANOs NORM – normalização das expressões temporais Identificação Classificação

31 Resultados Cenário total com avaliação estrita de ALTs

32 Resultados Cenário total com avaliação relaxada de ALTs

33 Resultados Cenário próprio com avaliação relaxada de ALTs 33 33

34 Avaliação por categorias (melhores sistemas)
Precisão Abrangência Medida-F

35 Agradecimentos A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.


Carregar ppt "Encontro do Segundo HAREM"

Apresentações semelhantes


Anúncios Google