Gabriel de Albuquerque Styve Stallone.  O que foi feito na área  Potenciais parceiros  Possíveis soluções para o problema.

Slides:



Advertisements
Apresentações semelhantes
Flip-Flops e Dispositivos Correlatos
Advertisements

Introdução à Programação: uma Abordagem Funcional PD I – Engenharia Elétrica Prof.ª Claudia Boeres 2008/2.
Algoritmo e Programação
Análise de Voz e Vídeo Reconhecimento de voz baseado em modelos de palavras conectadas André Vitor de Almeida Palhares.
O Áudio (Parte I) Prof. AMOUSSOU DOROTHÉE
INTELIGÊNGIA COMPUTACIONAL
ÁREA DE CONHECIMENTO ALFABETIZAÇÃO.
Criação e publicação de podcasts educativos
Redes Neurais Artificiais
Sistema Gerenciador de Banco de Dados SGBD
Interfaces Conversacionais
Redes de Hopfield Redes Neurais COPIN
Reconhecimento de Padrões Segmentação
Reconhecimento de Padrões Dissimilaridade
Iana Alexandra Alves Rufino
Redes de Kohonen Paulo Adeodato e Germano Vasconcelos
Inteligência Artificial
FACENS – Engenharia da Computação Inteligência Artificial
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
Matraca – Software para Auxílio de Invisuais no Uso do Computador
Linguagem PHP Prof.: Sergio Pacheco Prof.: Sergio Pacheco 1 1.
Lex e Yacc.
Tradução e adaptação, Ana Luiza Navas
Márcio Geovani Jasinski
Introdução a Programação
CURSO DE CAPACITAÇÃO EM EaD Vídeo-aula e Videoconferência
Vox Mensagens de Voz Recuperação de Crédito
Data Mining como ferramenta de Gestão
Animação Facial Aluno: Marcos Paulo Moreti
Gramáticas Livres de Contexto
Área de Pesquisa: Redes de Computadores
Linguagem de programação
Fala e Movimentação Facial em Avatares
TÉCNICAS DE COMPRESSÃO DE DADOS DISCIPLINA:R.COM..
Faculdade Talentos Humanos - FACTHUS - Algoritmo I - Rogério Rodrigues
Objetivo Nosso objetivo é desenvolver uma proposta de aula simples, utilizando alguns recursos do software graphmatica (na verdade o utilizaremos apenas.
Analise Semântica aula-10-analise-semântica.pdf.
Síntese de voz utilizando avatares GPVoz Gabriel de Albuquerque Styve Stallone.
Informações implícitas
Camada de redes: entrega, encaminhamento e roteamento.
Projeto Final MCI 2004 Filtragem de s Agente de Classificação de SPAM.
(OU) Hardware da Rede Implementacao da rede
Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.
Tabela Hash Alunos : Gustavo Jorge Zanin nºUSP
Física Experimental I Prof. Ms. Alysson Cristiano Beneti
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Mineração de Dados: Introdução
VETORES Prof: Wilson.
Síntese de voz Para Avatares GPVoz Gabriel Azuirson Styve Stallone.
Sistema de Embalagens Inteligentes para auxílio de deficientes visuais
O áudio.
HAC 1 MD - junho/2008 Tecnologias de suporte à Mineração de Dados Gerenciamento de dados Data Warehouse OLAP Arquiteturas Visualização Sistemas de Suporte.
A música e a voz A música e a voz © 2001 Wilson de Pádua Paula Filho.
Classificação de Textos
Biométria por Impressão Digital
Técnicas de Compressão de Dados
Tipos de Dados Todo o trabalho realizado por um computador é baseado na manipulação das informações contidas em sua memória. Estas informações podem.
Redes Neurais Artificiais Prof. Júlio Cesar Nievola PPGIA – PUCPR Especialização em Inteligência Computacional.
tópicostópicos itens 01. Terminologia 02. Operações básicas 03. Representação de linguagens 04. Formalização de gramáticas 05. Processo de derivação 06.
Colégio da Imaculada Curso Técnico em Informática
Distribuição Normal de Probabilidade
Reforço 3 Maria Augusta Constante Puget (Magu). Grandeza Escalar (1) Apenas o número e sua respectiva unidade caracteriza a grandeza física. Exemplos:
Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais – parte I Prof. Dalton Martins Gestão da Informação Universidade.
Sincronização Em multimídia: relações temporais entre objetos de mídias Objetos dependentes de tempo: –apresentados como um feixe de mídia –relações temporais.
Gráficos – Parte I CEPZ1 – 2015 – AULA 08 PROFESSORA: BRUNA CAVALLINI E RODRIGUES.
CEPZ1 – 2015 – AULA 09 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
CEPZ1 – 2015 – AULA 06 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
Capítulo 14 Camada 6 A Camada de Apresentação. Sumário A Camada de Apresentação.
Transcrição da apresentação:

Gabriel de Albuquerque Styve Stallone

 O que foi feito na área  Potenciais parceiros  Possíveis soluções para o problema

 DOXVOX desenvolvido na UFRJ, utilizada síntese de difones. Gratuito e Open Souce.  síntese de difones é baseada em concatenação de difones, que são pequenas seqüências de áudio que amostram a transição da metade de um fonema para a metade de outro.  O mecanismo utiliza-se de uma tabela que onde são guardados grafemas e seus respectivos fonemas. Palavras que fogem a regra podem ser guardadas por inteiro.  Um dos sistemas de acessibilidade mais usados no país.

 Na UFRGS, aluno está desenvolvendo um projeto de leitor de livros com o sintetizador de voz Open Souce eSpeek.  UFRJ criadora do DOXVOX  A UFRGS depois da parceria com a CSLU, reforçou a necessidade de buscar parcerias com outras instituições.

 O modulo TTS faz a transformação de texto para fala. Atualmente existem muitos sintetizadores disponíveis no mercado.  Podemos dividir o modulo TTS em 2 partes  A primeira parte pega o texto e transforma em uma seqüências de fonemas (pode ser uma tabela de associação), também faz a conversão de datas, números e demais símbolos para fonemas.  A segunda parte que através da seqüência de fonemas e parâmetros como intensidade e duração, realiza a síntese da voz. Pré-processamentosintese vozTexto

 O Modulo Extração de Fonemas é um reconhecedor de padrões, que podemos dividir em duas partes.  O modulo de extração de características que ao receber o arquivo de áudio, captura as informações mais importantes para o reconhecimento. EX: Numero de vezes que o final cruza o eixo horizontal, distancia entre picos.  E um módulo de comparação que irá usar um algoritmo para comparar com padrões previamente treinados. ( Redes Neurais, Quantização Vetorial, etc)  Deixaremos como próximo passo o estudo das técnicas de reconhecimento de padrões. VozFonema Extração de Parametoscomparação

 Resumidamente o primeiro módulo realiza a síntese, e o segundo modulo realiza um reconhecimento.  Mais em todos os mecanismos de síntese já está embutida a parte que faz a tradução de grafemas para fonemas (tabelas de conversão).  Podemos utilizar essa tabela para obter os fonemas resultantes sem precisar do segundo modulo.

 O módulo interpretação faz a associação de um fonema recebido pelo modulo extração do fonema com o visema correspondente no banco de visemas.  Uma simplificação utilizada na pratica, é fazer os visemas para representar apenas sons de vogais.

 O modulo de animação receberá os visemas e sua intensidade e duração.  Visemas além dos movimentos labiais, podem representar expressões. Ex: surpresa  Para isso o texto precisa ser adaptado para conter informações emocionais.