A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Miguel Salles Dias Director. Agenda Microsoft e o processamento da fala e da língua natural Microsoft e o processamento da fala e da língua natural Produtos.

Apresentações semelhantes


Apresentação em tema: "Miguel Salles Dias Director. Agenda Microsoft e o processamento da fala e da língua natural Microsoft e o processamento da fala e da língua natural Produtos."— Transcrição da apresentação:

1 Miguel Salles Dias Director

2 Agenda Microsoft e o processamento da fala e da língua natural Microsoft e o processamento da fala e da língua natural Produtos de fala Microsoft Produtos de fala Microsoft Iniciativa Microsoft de I&D em Portugal Iniciativa Microsoft de I&D em Portugal Conclusão Conclusão Perguntas e Respostas Perguntas e Respostas

3 Microsoft e o processamento da fala e da língua natural Investimentos em I&D de longo termo 1991: Fundação do grupo de Língua Natural na MS Research 1992: Grupo de Fala criado 1995: Primeiras ferramentas de revisão no MS Word 1998: Grupo de desenvolvimento de produto formado 2000: Investimento ao nível da divisão Hoje: Distribuição de produtos empacotados em todas as plataformas Congrega talento reconhecido de I&D mundial em Fala e Língua Natural Objectivo: tecnologias da língua natural e da fala com impacto no quotidiano

4 Microsoft e o processamento da fala e da língua Speech and natural language understanding are the key technologies that will have the most impact in the next 15 years. Speech and natural language understanding are the key technologies that will have the most impact in the next 15 years. Bill Gates

5 Fala integrada em diversas plataformas Desktop IU ricaIU rica Microfone partilhadoMicrofone partilhado Utilizador controlaUtilizador controla fala/escuta fala/escuta Telefone Somente vozSomente voz Aplicação controla fala/escutaAplicação controla fala/escuta Computação Móvel Interface MultimodalInterface Multimodal

6 Productos de fala Microsoft actuais Telefonia DesktopMobilidade Embedded SR Command/Control Dictation Enterprise Applications

7 Iniciativa Microsoft de I&D nos domínios da fala e língua natural, em Portugal

8 Desenvolvimento do suporte computacional a uma nova língua Características locais (caso Português) Língua: Português Europeu Regionalismos linguísticos Jargão profissional: medicina, direito, engenharia, economia Fala: Pronúncias regionais Fala das crianças, etc. Alterações constantes Evolução da língua: neologismos, termos em desuso Actualizações oficiais da língua: acordo ortográfico Processamento intensivo de dados Necessita de centenas do horas de corpora Necssita de peritos e cientistas em linguistica e língua natural A I&D é melhor realizada por peritos e cientistas com conhecimento linguístico local!

9 Potenciar a indústria de software e a I&D locais 1. Investimento Directo Estrangeiro (IDE) Em I&D Na Indústria de Software Nacional Potenciado com parceiras locais com a Microsoft Universidades, Empresas, Institutos, Laboratórios e Unidades de I&D FCT Portuguesas 2. Protecção da Propriedade Intelectual 3. Industrializar e Exportar Software Nacional

10 Situação da indústria de software e da I&D em Fala e Língua Natural, em Portugal

11 Indústria Portuguesa de software PRIBERAM, PT Inovação,

12 A I&D Nacional em fala e língua natural 1. CLUL, Centro de Linguística da Universidade de Lisboa, Maria do Céu Viana 2. CLUNL, Centro de Estudos Comparados de Línguas e Literaturas Modernas, Universidade Nova de Lisboa, Maria Teresa Lino 3. CLUP/FLUP, Faculdade de Letras da Universidade do Porto, Belinda Maia 4. ILTEC (Instituto de Linguística Teórica e Computacional), Maria Helena Mira Mateus 5. L2F - Laboratório de sistemas de Língua Falada, Isabel Trancoso 6. LabEL-CAUTL/IST, Laboratório de Engenharia da Linguagem do Centro de Automática da Universidade Técnica de Lisboa, Instituto Superior Técnico, Elisabete Ranchhod 7. NLX - Grupo de Linguagem Natural do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa, António Branco 8. SINTEF, Oslo, Diana Santos 9. Departamento de Informática da Universidade do Minho, José João Dias de Almeida, Pedro Rangel Henriques 10. XLDB/LasiGE/FCUL- Centro de Recursos Distribuído para a Língua Portuguesa, Faculdade de Ciências da Universidade de Lisboa, Mário Gaspar da Silva

13 Iniciativas de I&D Linguateca: Centro de recursos – distribuído – para o Processamento computacional da Língua Natural Portuguesa Rede de grupos de investigação em PLN, iniciada em 2000 pela FCCN Modelo IRA: Informação – Recursos – Avaliação I: > 1000 links Mais de 1,8 milhões de visitas ao sítio R: AC/DC, CETEMPúblico, COMPARA, Corpógrafo, Floresta Sintá(c)tica, WPT-03 Recursos (públicos) valiosos para o Português A: Morfolimpíadas, CLEF, HAREM: Avaliação conjunta para o Português Avaliação conjunta para o Português I & D no processamento do Português Osl o Lisboa XLDB Porto Odense Coimbra Lisboa COMPARA Lisboa LabEL Braga

14 Iniciativas de I&D - TECNOVOZ

15 Iniciativas de I&D TECNOVOZ : Reconhecimento e Síntese de Fala Projecto apoiado no âmbito dos PMDT (Portaria nº 1183/2001, de 15 Outubro); Projecto apoiado no âmbito dos PMDT (Portaria nº 1183/2001, de 15 Outubro); Investimento: 12 Milhões Euros Investimento: 12 Milhões Euros Calendário: Dez – Set Calendário: Dez – Set Investigação em Consórcio, com 12 Organizações (4 ESCTN e 8 Empresas) Investigação em Consórcio, com 12 Organizações (4 ESCTN e 8 Empresas) 166 Técnicos das Organizações Consórcio 166 Técnicos das Organizações Consórcio Vai desenvolver 13 produtos/sistemas para 10 segmentos de mercado Vai desenvolver 13 produtos/sistemas para 10 segmentos de mercado Microsoft foi convidada para colaboração estreita Microsoft foi convidada para colaboração estreita

16 L2F - Laboratório de sistemas de Língua Falada Historial Português falado desde anos Investigadores (8 PhD) Missão Conversão Fala-para-Texto e Texto-para-Fala em Português: Fazer a ponte entre a língua falada e a informação semântica subjacente Tecnologias de base Reconhecimento, síntese e codificação de fala Ferramentas de PLN: análise morfológica, sintáctica, semântica, geração, etc.

17 Exemplo de cooperação: desenvolvimento do modelo de fala Corpora Léxico Modelo Acústico Novo Corpora Novo Lexico Novo Modelo Acústico Motor de Reconhecimento de Fala Localizado Processo Iterativo at é que o n í vel de qualidade seja atingido Parceiros de I&D e empresariais locais Empregados Microsoft locais Modelo de Língua Novo Modelo de Língua Motor de Reconhecimento de Fala

18 Estratégia de desenvolvimento de língua da Microsoft Desenvolvimento em Redmond (EUA) Desenvolvimento local e parcerias com peritos e cientistas do país Ecosistema com 3as Partes para tecnologias de Fala e Língua Natural Piloto Piloto Modelo de I&D em colaboração EUA-Europa (Portugal) Modelo de I&D em colaboração EUA-Europa (Portugal) Parcerias locais estratégicas Parcerias locais estratégicas Modelo Português passível de exportação Modelo Português passível de exportação Futuro: comunidade internacional dinâmica expandindo a tecnlogia

19 Iniciativa Microsoft de I&D em Portugal - Estratégia 1. Fundação de um Centro de I&D em Interacção Natural Pessoa-Máquina Director: Miguel Salles Dias Ramo do grupo de Redmond Recebe ferramentas e conhecimento do grupo de Redmond e da Microsoft Corporation Inicia com projectos de Fala, Língua Natural e Escrita em Português Tratará no médio-longo prazos, da interacção natural pessoa-computador em geral 2. Parcerias locais com Universidades, Empresas, Institutos, Laboratórios e Unidades de I&D FCT I&D com recursos de ambas as partes Acordos de partilha de Propriedade Intelectual

20 Iniciativa Microsoft de I&D em Portugal – Plano curto prazo Objectivos a curto prazo (em estudo) Obtenção de recursos linguísticos de Fala Projecto 1: Beta para demo Fala no desktop Comandos e controlos básicos Projecto 2: Modelos de Reconhecimento de Fala para Telefonia Versão localizada do Voice Command Projecto 3: Toolkit de Recursos para Desenvolvimento e Teste de FLN

21 Iniciativa Microsoft de I&D em Portugal – Plano médio prazo Objectivos a médio prazo (em estudo): Projecto 4: Modelos de Língua e Modelos de Ditado no Desktop Projecto 5: Componentes de Língua Natural Projecto 6: Análise Gramatical Projecto 7: Text To Speech – TTS Colaboração com MSR: Projecto 8: Machine Translation Projecto 9: Interfaces multimodais em desktop Projecto 10: Interfaces multimodais em mobilidade

22 Iniciativa Microsoft de I&D em Portugal - Recursos Recursos humanos – próprios (em estudo): Director – Gestor de Programa Desenvolvimento: 1 a 2 por projecto Teste: 1 a 2 por projecto Perito(a) em Linguística: 2 para os 10 projectos Em velocidade de cruzeiro, com todos os projectos a decorrer: podemos atingir os 25 recursos próprios Em cada projecto vamos estabelecer parcerias estratégicas de mútuo interesse Recursos humanos Microsoft + parceiros podem atingir os 75 Investimento próprio (em estudo) : No primeiro ano: 1.2 MEuro Em velocidade de cruzeiro, com os 5 projectos a decorrer em simultâneo: 2 MEuro/ano

23 Conclusão 1. Microsoft: fala e língua natural são importantes Cobertura extensa de línguas a nível global (ex: Word 12 suporta mais de 70 Línguas) 2. IDE em I&D 3. Colaboração com as empresas e os cientistas em Portugal Juntos servimos melhor os utilizadores de computadores Portugueses

24 Obrigado pela vossa atenção Miguel Salles Dias Tratamento computacional da fala e língua portuguesas 1º Centro de I&D Microsoft

25 Sessão de perguntas e respostas


Carregar ppt "Miguel Salles Dias Director. Agenda Microsoft e o processamento da fala e da língua natural Microsoft e o processamento da fala e da língua natural Produtos."

Apresentações semelhantes


Anúncios Google