A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Indexação Automática e Etiquetadores parte do discurso (POS tagger)

Apresentações semelhantes


Apresentação em tema: "Indexação Automática e Etiquetadores parte do discurso (POS tagger)"— Transcrição da apresentação:

1 Indexação Automática e Etiquetadores parte do discurso (POS tagger)
Equipe: Camila Oliveira Celson Farias Maxwell Francisco

2 Linguistica Computacional
Originada em meados de 1950 Buscam desenvolver sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural. Preocupam-se diretamente com o estudo da linguagem voltado para a construção de softwares e sistemas computacionais específicos, como tradutores automáticos, chatterbots, parsers, reconhecedores automáticos de voz, geradores automáticos de resumos etc.

3 Indexação automática Na indexação automática, segundo Santos e Ribeiro (2003), um programa de computador, adotando critérios de freqüência, extrai palavras, expressões ou radicais de palavras do texto para representar o seu conteúdo como um todo. Lancaster (2004, p ) define dois tipos diferentes de indexação automática. A indexação por extração automática e a indexação por atribuição automática.

4 Indexação na Recuperação da informação

5 Etiquetadores Parte do Discurso (POS tagger)
Sistemas que exercem a função de percorrer todo o texto etiquetando todas as palavras segundo sua categoria gramatical, Envolve uma análise da palavra segundo o contexto que a mesma se encontra, como por exemplo, definir a sua relação com as palavras adjacentes em uma frase ou em um parágrafo.

6

7 Exemplo do POS tagger "O meu tio é português" e observe os resultados para as ferramentas etiquetadoras em questão: I) TreeTagger: "o/DET meu/ADJ tio/NOM é/V português/ADJ" II) Ogma: "o/AD meu/PS tio/SU é/VB português/AJ"

8

9

10 Conclusão As ferramentas de etiquetas POS juntamente com suas ferramentas auxiliadoras vieram também para aprimorar a Lingüística Computacional no que diz respeito à indexação, armazenamento e recuperação de informações, pois, um dos fatores que dificultava esse processo, é a ambigüidade dos termos.


Carregar ppt "Indexação Automática e Etiquetadores parte do discurso (POS tagger)"

Apresentações semelhantes


Anúncios Google