A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estado da Arte Anderson Gomes Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS.

Apresentações semelhantes


Apresentação em tema: "Estado da Arte Anderson Gomes Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS."— Transcrição da apresentação:

1 Estado da Arte Anderson Gomes

2 Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS  Nagoya Institute of Technology

3 Google  Possui um grupo de pesquisa de voz  GAudi Sistema de reconhecimento de voz Utilizado para indexar palavras faladas em vídeos Restringe-se a política Vocabulário será ampliado  Mudar o “modo” de se fazer uma pesquisa

4 DARPA  Grupo de pesquisa de voz  Sistema de tradução entre diversas línguas para uso militar  Não realiza transcrição

5 IBM  Possui um grupo de pesquisa de voz  ViaVoice Reconhece uma única Voz  Sisi Transforma a voz do usuário em sinais para comunicação com deficientes auditivos Avatares representam os sinais  Fortes avanços no desenvolvimento de um sistema de reconhecimento de voz audio-visual

6 Philips  Speech Magic Softwares e hardwares Reconhece uma única Voz  Speech SDK Reconhece uma única Voz SDK para ser usada no desenvolvimento de outros softwares

7 Nuance - Dragon Systems  Dragon NaturallySpeaking Reconhece uma única voz

8 INESC-ID  TECNOVOZ Amplo projeto envolvendo algumas empresas e universidades Abrange vários projetos, inclusive transcrição e legendagem automática O INESC-ID é responsável pelo módulo de conversão fala-texto, além de outros

9 UFRJ  Implementação de um LVCSR para o português brasileiro Rafael Teruszkin Fernando Gil Vianna Resende Junior

10 UCS  BRAVOZ – Reconhecimento de voz com suporte a grandes vocabulários (LVCSR) para o português brasileiro Verônica Feldkircher Vanessa Davanzo André Gustavo Adami (orientador)

11 Nagoya Institute of Technology  Julius Software open source de reconhecimento de voz Japonês Pode ser integrado a outras línguas

12 Arquitetura Speech input Feature vector Subword models Spectral analysis Word-level match Sentence-level match Lexicon SemanticsGrammar Word model composition Word model Recognized sentence

13 Arquitetura – Primeiro passo  Spectral analysis Retorna o vetor das características do sinal de voz Feature vector Spectral analysis Speech input

14 Arquitetura – Segundo passo  Junção de duas partes: World-level match Sentence-level match Word-level match Sentence-level match

15 Arquitetura – Segundo passo  Word-level match: Conjunto de subpalavras HMMs Forma léxica das palavras Criação de conjunto de modelo de palavras HMMs Subword models Word-level match Sentence-level match Lexicon Semantics Grammar Word model composition Word model

16 Arquitetura – Segundo passo  Sentence-level match: Word grammar (syntax) Semantics Composição de um modelo de linguagem FSN Subword models Word-level match Sentence-level match Lexicon Semantics Grammar Word model composition Word model

17 Arquitetura – Segundo passo  Integração do word-level match e do sentence-level match Level Building (LB) algorithm Exemplo de integração de uma gramática FSN em um algoritmo LB

18 Arquitetura  Após a integração dos módulos de word- level match e sentence-level match é formada a sentença reconhecida Subword models Word-level match Sentence-level match Lexicon Semantics Grammar Word model composition Word model Recognized sentence


Carregar ppt "Estado da Arte Anderson Gomes Principais Empresas e Centros de Pesquisa  Google  Darpa  IBM  Philips  Nuance  INESC  UFRJ  UCS."

Apresentações semelhantes


Anúncios Google