A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de.

Apresentações semelhantes


Apresentação em tema: "Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de."— Transcrição da apresentação:

1 Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de Risco e Inteligência Artificial (HARPIA) Jorge Jambeiro Filho Marcos Cardoso Jacques Wainer

2 Classificação Fiscal Toda mercadoria é enquadrada uma dentre cerca de 9700 classificações fiscais TEC. Toda mercadoria é enquadrada uma dentre cerca de 9700 classificações fiscais TEC. As alíquotas dos tributos incidentes na importação e exigências administrativas, sanitárias, militares e de segurança dependem desta classificação. As alíquotas dos tributos incidentes na importação e exigências administrativas, sanitárias, militares e de segurança dependem desta classificação. É fundamental que a classificação fiscal esteja correta. É fundamental que a classificação fiscal esteja correta.

3 Verificação por amostragem A SRF não possui fiscais suficientes para checar todas as mercadorias sendo importadas. A SRF não possui fiscais suficientes para checar todas as mercadorias sendo importadas. A SRF não pretende checar todas as mercadorias, pois isto traria prejuízo a economia nacional. A SRF não pretende checar todas as mercadorias, pois isto traria prejuízo a economia nacional. É preciso selecionar de forma automática uma amostra de mercadorias que seja pequena em relação ao total de importações mais inclua a maior parte das infrações. É preciso selecionar de forma automática uma amostra de mercadorias que seja pequena em relação ao total de importações mais inclua a maior parte das infrações. Neste trabalho nos focamos apenas nas infrações correspondentes a erros de classificação fiscal. Neste trabalho nos focamos apenas nas infrações correspondentes a erros de classificação fiscal.

4 Probabilidade de erro de classificação fiscal A probabilidade de erro é estimada com base na proporção entre erros e acertos no passado. A probabilidade de erro é estimada com base na proporção entre erros e acertos no passado. A probabilidade depende do importador, da classificação declarada, do país de origem, etc. A probabilidade depende do importador, da classificação declarada, do país de origem, etc. São bilhões de combinações de atributos, a maior parte delas com histórico pequeno ou vazio. São bilhões de combinações de atributos, a maior parte delas com histórico pequeno ou vazio. Históricos reduzidos provocam um problema clássico no aprendizado de máquina chamado de overfitting Históricos reduzidos provocam um problema clássico no aprendizado de máquina chamado de overfitting

5 Estratégias tradicionais para evitar overfitting Evitar observar o impacto de combinações envolvendo muitos atributos diretamente. Evitar observar o impacto de combinações envolvendo muitos atributos diretamente. Combinar o impacto de cada atributo em separado fazendo suposições de independência. Combinar o impacto de cada atributo em separado fazendo suposições de independência. Perde-se a capacidade de perceber interações entre atributos. Exemplo: Perde-se a capacidade de perceber interações entre atributos. Exemplo: –Um importador XYZ comete poucos erros em média. –A classificação fiscal ABC raramente está incorreta. –Porém, quando XYZ faz uma importação supostamente na classificação ABC ela costuma estar incorreta.

6 Abordagem hierárquica multinível Observa atributos tanto em separado quanto em conjunto Observa atributos tanto em separado quanto em conjunto Níveis mais genéricos geram distribuições de probabilidade prévias de Dirichlet Níveis mais genéricos geram distribuições de probabilidade prévias de Dirichlet As observações conjuntas predominam quando existe fartura de exemplos As observações conjuntas predominam quando existe fartura de exemplos {} {Imp}{Classe}{Pais} {Imp,Classe} {Imp,Pais}{Classe,Pais} {Imp,Classe,Pais}

7 Descrição da mercadoria O importador fornece uma descrição textual da mercadoria. O importador fornece uma descrição textual da mercadoria. Usando métodos de classificação de textos medimos o quanto a descrição fornecida está dentro ou fora do padrão para a classificação fiscal declarada. Usando métodos de classificação de textos medimos o quanto a descrição fornecida está dentro ou fora do padrão para a classificação fiscal declarada. O resultado deste processo é combinado com a análise hierárquica dos demais atributos. O resultado deste processo é combinado com a análise hierárquica dos demais atributos.

8 Resultados TAXA DE RETORNO TAXA DE SELEÇÃO 25%50%1%5%10% HPB+DescriçãoTAXADESELEÇÃO2%8%TAXADESELEÇÃO20%42%57% HPB2%11%17%35%48% Noisy-Or5%15%10%26%40% Aleatório25%51%1%5%10%

9 Conclusões Empregando um método probabilístico simples temos resultados 3 vezes melhores que com a seleção aleatória. Empregando um método probabilístico simples temos resultados 3 vezes melhores que com a seleção aleatória. Usando uma abordagem hierárquica multinível e tratando a descrição textual da mercadoria temos resultados 6 vezes melhores que com a seleção aleatória. Usando uma abordagem hierárquica multinível e tratando a descrição textual da mercadoria temos resultados 6 vezes melhores que com a seleção aleatória.


Carregar ppt "Uso de Métodos Bayesianos na Detecção de Erros de Classificação Fiscal de Mercadorias em Processo de Importação Secretaria da Receita Federal Análise de."

Apresentações semelhantes


Anúncios Google