A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Márcio Geovani Jasinski

Apresentações semelhantes


Apresentação em tema: "Márcio Geovani Jasinski"— Transcrição da apresentação:

1 Márcio Geovani Jasinski
Sistema de Reconhecimento de voz na Radiologia com vocabulário restrito Márcio Geovani Jasinski Projeto Cyclops Laboratório de Telemedicina Universidade Federal de Santa Catarina

2 Estrutura da Apresentação
Introdução Metodologia Resultados Discussões e Conclusões

3 Introdução Projeto Cyclops - software na área médica desde 1998;
Tecnologias - dinamizar o processo de laudo; Resistência médica na aceitação do software; Cenários no processo de geração de laudo: 1. Laudo manuscrito: Letra ilegível; Documentos perdidos; Recuperação do documento (histórico); Relação manual com as demais informações do exame.

4 Introdução – Cenários existentes
2. Laudo ditado em fitas: Fitas regravadas – qualidade ruim e sem histórico; Fitas danificadas ou perdidas; Problemas com etiquetas;

5 Introdução - Cenários existentes
Ambiente ideal 3. Laudo ditado em áudio digital e rec. de voz: Alta qualidade do áudio; Transcrição automática; Permite ao médico ditar o laudo com as mãos livres para manipulação do equipamento; Dinamiza o processo e evita os erros do processo manual ou com fitas; Histórico do ditado;

6 Introdução - Tecnologias de laudo:
PACS - Sistema para arquivamento e comunicação em diagnóstico por imagem. DICOM Structured Report - Padrão DICOM para laudos estruturados; Telemedicina – Tecnologia médica acessível de qualquer lugar que evita deslocamento excessivo de pacientes; Áudio Digital - Gravação laudo com qualidade e que permite reconhecimento de voz. Reconhecimento de voz - Processo de obter palavras faladas e transcrição para texto ou DICOM SR;

7 Metodologia PACS com portal de telemedicina: Desafios:
Hospital Universitário – UFSC; Estado de Santa Catarina; Desafios: Resistência na digitação dos laudos; Dinamizar geração de laudos de setores de alta demanda – Radiologia HU/UFSC 21 exames/dia; Quilombo ECG – Antes: 20 exames/mês, Após a implantação da telemedicina: 91,5 exames/mês

8 Metodologia – Soluções livres
Tecnologias livres, open-source e multi-plataforma: Linux – Sistema operacional; PortAudio – Entrada e saída de áudio; wxWidgets – Interface gráfica para o usuário; HTK – Biblioteca para reconhecimento de voz; Postgresql – Armazenamento de informações;

9 Metodologia – Vocabulário
O vocabulário médico: Bem definido e formal; A definição de perplexidade, indica a Radiologia “Número médio de palavras possíveis depois que o modelo de linguagem foi aplicado.” Domínio Perplexidade Radiologia 20 Medicina de emergência 60 Jornalismo 105 Fala geral 247

10 Metodologia – Reconhecimento de voz
Sistema de rec. de voz é constituído de: Definição de Gramática e do Dicionário Regras usadas no reconhecimento; Definição do Modelo Acústico Forma de representação para análise - HMMs; Definição do corpo de treinamento Frases e palavras ditadas para rec. de padrões;

11 Metodologia – Reconhecimento de voz
Definição dos modelos HMMS Número de estados e valores iniciais; Configurações de codificação Parâmetros e algoritmos para o rec./ treino; Treinamento Ditado para balancear os valores do modelo; Reconhecimento/Avaliações Uso do sistema e verificação dos resultados

12 Resultados Análise realizada com ferramentas do HTK:
Gramática: 5 palavras – Acerto de 80% a 99%; Inexistência de dicionário português: 50 Gravações e 150 marcações;

13 Resultados Implementações: Laudo ditado com integração com o portal;
Módulo para ditado no software de captura;

14 Discussões e Conclusões
O uso de laudo áudio digital com a telemedicina é um avanço excelente pois: Reduz a resistência na aceitação do sistema; Evita erros inerentes ao processo manual; Mantém histórico do ditado; Permite o reconhecimento de voz automatizado; Gravação de laudo por Palmtops.

15 Discussões e Conclusões
Definir uma base de dados, que permita o reconhecimento de voz em larga escala; Rec. De voz com gramática definida conduz ao DICOM SR pela forma não ambígua de ambos; Forma de armazenamento compactado – verificar a viabilidade com rec. De voz


Carregar ppt "Márcio Geovani Jasinski"

Apresentações semelhantes


Anúncios Google