Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouIasmin Lizardo Alterado mais de 10 anos atrás
1
Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de Risco e Inteligência Artificial (HARPIA) Jorge Jambeiro Filho Marcos Cardoso Jacques Wainer
2
Classificação Fiscal Toda mercadoria é enquadrada uma dentre cerca de 9700 classificações fiscais TEC. As alíquotas dos tributos incidentes na importação e exigências administrativas, sanitárias, militares e de segurança dependem desta classificação. É fundamental que a classificação fiscal esteja correta.
3
Verificação por amostragem
A SRF não possui fiscais suficientes para checar todas as mercadorias sendo importadas. A SRF não pretende checar todas as mercadorias, pois isto traria prejuízo a economia nacional. É preciso selecionar de forma automática uma amostra de mercadorias que seja pequena em relação ao total de importações mais inclua a maior parte das infrações. Neste trabalho nos focamos apenas nas infrações correspondentes a erros de classificação fiscal.
4
Probabilidade de erro de classificação fiscal
A probabilidade de erro é estimada com base na proporção entre erros e acertos no passado. A probabilidade depende do importador, da classificação declarada, do país de origem, etc. São bilhões de combinações de atributos, a maior parte delas com histórico pequeno ou vazio. Históricos reduzidos provocam um problema clássico no aprendizado de máquina chamado de overfitting
5
Estratégias tradicionais para evitar overfitting
Evitar observar o impacto de combinações envolvendo muitos atributos diretamente. Combinar o impacto de cada atributo em separado fazendo suposições de independência. Perde-se a capacidade de perceber interações entre atributos. Exemplo: Um importador XYZ comete poucos erros em média. A classificação fiscal ABC raramente está incorreta. Porém, quando XYZ faz uma importação supostamente na classificação ABC ela costuma estar incorreta.
6
Abordagem hierárquica multinível
Observa atributos tanto em separado quanto em conjunto Níveis mais genéricos geram distribuições de probabilidade prévias de Dirichlet As observações conjuntas predominam quando existe fartura de exemplos {} {Imp} {Classe} {Pais} {Imp,Classe} {Imp,Pais} {Classe,Pais} {Imp,Classe,Pais}
7
Descrição da mercadoria
O importador fornece uma descrição textual da mercadoria. Usando métodos de classificação de textos medimos o quanto a descrição fornecida está dentro ou fora do padrão para a classificação fiscal declarada. O resultado deste processo é combinado com a análise hierárquica dos demais atributos.
8
Resultados HPB+Descrição HPB Noisy-Or Aleatório 25% 50% 1% 5% 10%
TAXA DE RETORNO TAXA DE SELEÇÃO 25% 50% 1% 5% 10% HPB+Descrição T A X D E S L Ç Ã O 2% 8% 20% 42% 57% HPB 11% 17% 35% 48% Noisy-Or 15% 26% 40% Aleatório 51%
9
Conclusões Empregando um método probabilístico simples temos resultados 3 vezes melhores que com a seleção aleatória. Usando uma abordagem hierárquica multinível e tratando a descrição textual da mercadoria temos resultados 6 vezes melhores que com a seleção aleatória.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.