Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de.

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Aprendizado de Máquina
Amostragem Estatística
ANÁLISE DISCRIMINANTE LIG, 13 de novembro de 2008.
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ESTIMAÇÃO.
Mineração de Dados Avaliação de Classificadores
ESTATÍSTICA BÁSICA Engenharia Mecânica 15/03/2011.
Aula 8 Engenharia de Manutenção FMEA
11. Gerenciamento de riscos do projeto
Estatística Aula 17 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística Aula 15 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 6 Estimativas e Tamanho de Amostras
Jacques Robin, Francisco Carvalho, Flávia Barros
Métodos Quantitativos
INTELIGÊNCIA COMPUTACIONAL APLICADA AO TRATAMENTO DE AMBIGÜIDADES E REDUNDÂNCIAS NA BASE DE DADOS DE INTERVENIENTES ESTRANGEIROS Secretaria da Receita.
Sistema de Banco de Dados
Aspectos Avançados em Engenharia de Software Aula 3 Fernanda Campos
O VISOdespro O sistema auxilia o usuário na Classificação Fiscal de Mercadorias, trazendo o código NCM, alíquotas de impostos, ex-tarifários, destaques,
PLANEJAMENTO ESTRATÉGICO
3. Árvore de Decisão.
Aprendizado de Máquina Aula 8
O que é Estatística? Estatística é a ciência que se ocupa da obtenção de informações (...) com a finalidade de através de resultados probabilísticos adequados,
PMBOK 5ª Edição Capítulo 11
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
República Federativa do Brasil ORÇAMENTO 2005 PROJETO DE LEI Brasília, 01 de dezembro de 2004 Ministério do Planejamento, Orçamento e Gestão.
Apêndice.
ANOVA: Análise de Variância APLICAÇÃO.
Disciplina Auditoria I
CALIBRAÇÃO.
Modelagem Estatística
ESTATÍSTICA.
Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.
Estimação por ponto (o que trabalhar na amostra)
SAD - 2. Processo Decisório - Etapas
Amostragem Pontos mais importantes:
Técnicas de amostragem
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
Processo de Aquisição Adilson de Almeida Cezar Meriguetti
Aula 5 - Método experimental ou de seleção aleatória
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
Introdução à Estatística
Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:
Fiscal - Regra de imposto IdentificaçãoFIS_003 Data Revisão18/10/2013.
POPULAÇÃO-ALVO E AMOSTRA Capítulo 10 – Richardson
Amostragem probabilística Amostragem não-probabilística
Aula 11 - Teste de hipóteses, teste de uma proporção
Testes de Software AULA 02 Eduardo Silvestri
ANÁLISE ESTATÍSTICA II
Regra de imposto 1. 2 Objetivo Regra de imposto é o registro de uma combinação de impostos que será vinculada aos produtos que possuírem os tributos informados.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
Regra de imposto.
Aula 6. Delineamento amostral
Professor: WALDEMAR SANTA CRUZ OLIVEIRA JR CONCEITOS BÁSICOS UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE Curso: TURISMO Disciplina: ESTATÍSTICA BÁSICA ET-229.
ESTATISTICA Aula 1 PROF: CÉLIO SOUZA.
Conceitos de amostragem
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
9 - ROTEIRO PARA IMPORTAÇÃO IMPORTA FÁCIL
Sistemas Aplicativos para Usuários Finais USABILIDADE DE SOFTWARE.
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Amostragem Sistemática
NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional.
GESTÃO E GARANTIA DA QUALIDADE
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada à Administração Prof. Alessandro Moura Costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Transcrição da apresentação:

Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de Risco e Inteligência Artificial (HARPIA) Jorge Jambeiro Filho             Marcos Cardoso         Jacques Wainer

Classificação Fiscal Toda mercadoria é enquadrada uma dentre cerca de 9700 classificações fiscais TEC. As alíquotas dos tributos incidentes na importação e exigências administrativas, sanitárias, militares e de segurança dependem desta classificação. É fundamental que a classificação fiscal esteja correta.

Verificação por amostragem A SRF não possui fiscais suficientes para checar todas as mercadorias sendo importadas. A SRF não pretende checar todas as mercadorias, pois isto traria prejuízo a economia nacional. É preciso selecionar de forma automática uma amostra de mercadorias que seja pequena em relação ao total de importações mais inclua a maior parte das infrações. Neste trabalho nos focamos apenas nas infrações correspondentes a erros de classificação fiscal.

Probabilidade de erro de classificação fiscal A probabilidade de erro é estimada com base na proporção entre erros e acertos no passado. A probabilidade depende do importador, da classificação declarada, do país de origem, etc. São bilhões de combinações de atributos, a maior parte delas com histórico pequeno ou vazio. Históricos reduzidos provocam um problema clássico no aprendizado de máquina chamado de overfitting

Estratégias tradicionais para evitar overfitting Evitar observar o impacto de combinações envolvendo muitos atributos diretamente. Combinar o impacto de cada atributo em separado fazendo suposições de independência. Perde-se a capacidade de perceber interações entre atributos. Exemplo: Um importador XYZ comete poucos erros em média. A classificação fiscal ABC raramente está incorreta. Porém, quando XYZ faz uma importação supostamente na classificação ABC ela costuma estar incorreta.

Abordagem hierárquica multinível Observa atributos tanto em separado quanto em conjunto Níveis mais genéricos geram distribuições de probabilidade prévias de Dirichlet As observações conjuntas predominam quando existe fartura de exemplos {} {Imp} {Classe} {Pais} {Imp,Classe} {Imp,Pais} {Classe,Pais} {Imp,Classe,Pais}

Descrição da mercadoria O importador fornece uma descrição textual da mercadoria. Usando métodos de classificação de textos medimos o quanto a descrição fornecida está dentro ou fora do padrão para a classificação fiscal declarada. O resultado deste processo é combinado com a análise hierárquica dos demais atributos.

Resultados HPB+Descrição HPB Noisy-Or Aleatório 25% 50% 1% 5% 10% TAXA DE RETORNO TAXA DE SELEÇÃO 25% 50% 1% 5% 10% HPB+Descrição T A X D E S L Ç Ã O 2% 8% 20% 42% 57% HPB 11% 17% 35% 48% Noisy-Or 15% 26% 40% Aleatório 51%

Conclusões Empregando um método probabilístico simples temos resultados 3 vezes melhores que com a seleção aleatória. Usando uma abordagem hierárquica multinível e tratando a descrição textual da mercadoria temos resultados 6 vezes melhores que com a seleção aleatória.