A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Planejamento de Experimentos Aplicação ao SCAE Eliana Zandonade Estatística

Apresentações semelhantes


Apresentação em tema: "Planejamento de Experimentos Aplicação ao SCAE Eliana Zandonade Estatística"— Transcrição da apresentação:

1 Planejamento de Experimentos Aplicação ao SCAE Eliana Zandonade Estatística

2 Sumário Problema estatístico a ser resolvido Noções básicas do planejamento de experimento Como escolher uma base de dados representativa para o projeto Propostas de base de dados Atividades atuais

3 Problema estatístico Definir uma base de dados representativa que tenha como missão: 1) aferir a capacidade de classificação dos classificadores manuais; 2) estudar os modelos quanto a sua capacidade de resolver o problema proposto no projeto, considerando as particularidades; 3) calibrar os modelos automatizados propostos (baseados em aprendizado); 4) aferir a capacidade de classificação dos modelos propostos; 5) comparar estatisticamente estes modelos.

4 Planejamento Experimentos Da metodologia científica temos: Problema definido Planejamento do experimento: organização da pesquisa experimental Cálculo do Tamanho da amostra Coleta dos dados Análise estatística do problema Conclusões

5 Pesquisa Experimental Definição: Experimentos aleatórios são situações que ao serem repetidas nas mesmas condições não produzem o mesmo resultado. Definição: Planejamento de Experimento é uma atividade necessária para se descobrir informações sobre um processo ou sistema em particular

6 Processo a ser estudado: Processo Entrada Saída Fatores controláveis x1x xp z1z zq Fatores incontroláveis Y contrato social texto livre códigos descritores dicionário tabela cnae 2.0 conhecimento das regras interpretação Codificação errada

7 Método do Planejamento O delineamento é um teste ou uma série de testes que modifica propositalmente as variáveis de entrada para observar mudanças nas variáveis de saída.

8 Conseqüências da Utilização Redução da variabilidade; Redução de tempo; Redução de custos.

9 Três princípios Básicos REPETIÇÃO ALEATORIZAÇÃO FORMAÇÃO DE BLOCOS OU ESTRATOS

10 Nossa base de dados a)Repetição: Para cada código CNAE precisamos ter mais de um objeto social. O número de objetos sociais em questão depende da dificuldade de classificação de cada documento. Podemos, no entanto, definir que todos os documentos têm o mesmo grau de dificuldade e assim definir um número mínimo de documentos de cada código. Vamos chamar aqui de código, o código da atividade principal.

11 Nossa base de dados a)Aleatorização: Os objetos sociais devem ser escolhidos aleatoriamente, incluindo todas as possibilidades em todas as unidades da federação.

12 Nossa base de dados c) Formação de estratos: Definição das possíveis fontes conhecidas de variação de classificação dos códigos, como por exemplo as três esferas do governo: federal, estadual e municipal, os Códigos no nível hierárquico de subclasse e as demandas regionais (sul, sudeste, centro oeste, nordeste e sul).

13 Nossa base de dados BASE 1: dados da central de dúvidas do IBGE (texto da atividade principal, perguntas do IBGE e o código atribuído pelos especialistas). Ver documento! Ver Protótipo de avaliação BASE 2: dados de objeto social das prefeituras de Vitória e Belo Horizonte (texto das atividades e códigos atribuídos pelos órgãos). Ver documento!

14 Nossa base de dados BASE 3: Dados da pesquisa econômica do IBGE. Em torno de 30 mil empresas. Dados da atividade principal, perguntas e códigos. Ver documento! BASE 4: Base montada para os experimentos do projeto. Será criado um protótipo de entrada de dados com texto livre de atividades, perguntas adicionais e estes dados serão classificados pelos classificadores manuais. Ver documento!


Carregar ppt "Planejamento de Experimentos Aplicação ao SCAE Eliana Zandonade Estatística"

Apresentações semelhantes


Anúncios Google