Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouRegina de Miranda Botelho Alterado mais de 7 anos atrás
1
Curso de Jornalismo Investigativo: uma capacitação para organizações e ativistas locais Análise e filtro de dados: oficina prática Apresentação baseada na aula de Steve Doig, no curso Introdução ao Jornalismo de Dados - junho 2014Introdução ao Jornalismo de Dados
2
Link da apresentação http://goo.gl/EyMrqb
3
Tópicos do encontro ●Estatística e matemática de redação ●Filtrando e ordenando dados no Sheets ●Fazendo novas variáveis com funções ●Resumindo dados com tabelas dinâmicas
4
Estatística e matemática de redação
5
O quê? ●Calcular e usar: porcentagem, medianas, taxas, séries, médias e quartis ●Usar o desvio padrão para identificar valores atípicos ●Saber o que são correlação e regressão linear
6
Procure por padrões ●Análise de dados significa encontrar padrões ●Encontrar provas que vão além dos casos ●Encontrar casos também
7
Matemática de redação ●Má notícia: erros matemáticos destroem sua credibilidade ●Boa notícia: a matemática de redação é fácil; adicionar, subtrair, multiplicar e dividir
8
Mudança percentual ●Comparar um número novo com um número antigo ●Fórmula: (NOVO - ANTIGO) / ANTIGO Exercício: 24 assassinatos em 2013. 30 assassinatos em 2014.
9
Taxas ●Permite comparar lugares de diferentes tamanhos ●Fórmula: (EVENTO / POPULAÇÃO) * "Por" unidade Exercício: Cidade 1 (75.000 habitantes): 40 mortes. Cidade 2 (115.000 habitantes): 55 mortes.
10
Estatística univariável ●Estastística descritiva: analisa uma única variável num grupo de dados e descreve suas características
11
Medidas em relação ao centro ●Média: total de valores dividido pelo número de valores ●Mediana: o valor do meio em uma lista ordenada ●Moda: o valor mais comum ●Valores atípicos: valores que estão longe da média. É aqui que pode surgir uma matéria
12
Distribuição normal
13
●O pico fica no meio, na mediana ●Quanto mais larga for a curva, maior é o desvio padrão ●A curva cobre 100% dos dados Exemplo: salário dos jogadores de futebol
14
Variabilidade: dados que variam ●Máximo/mínimo: valores menores e maiores ●Série: a distância entre o maior e o menor ●Quartil: as medianas de cada metade da lista ordenada de valores o Primeiro quartil: metade de baixo da mediana o Terceiro quartil: metade de cima da mediana ●**Desvio padrão: distância média da média (não usamos o termo em matérias, serve para encontrar valores distantes do centro)
15
Desvio padrão ●Ajuda a definir se um valor é atípico mesmo ●Valores são atípicos se estiverem a mais de 3 desvio padrões da média. Eles estarão fora de 99.7% dos valores.
16
Regra empírica ●68% dos valores: até 1 desvio padrão ●95% dos valores: até 2 desvios padrões ●99,7% dos valores: até 3 desvios padrões …da média.
17
Normalidade ●Variabilidade é normal ●Valores até 3 desvios padrões da média são considerados normais
18
Estatística multivariável ●Correlação ●Regressão linear
19
Correlação ●Relação entre duas ou mais variáveis ●R de Pearson: série de -1 a 1 o R positivo: uma variável sobe, outra sobe o R negativo: uma variável sobe, outra desce ●Correlação não implica causação
20
Regressão linear ●Usada para calcular a variável dependente, baseado no valor da variável independente Pobreza* e notas na escola Tamanho da população* e número de crimes Você pode usar regressão linear para nivelar os dados e comparar melhor as notas das escolas, dada sua condição econômica.
21
Discussão ●Por que muitos jornalistas são avessos à matemática e estatística? ●De que forma não entender esses conceitos acaba nos deixando reféns de outras coberturas? ●O que você pode fazer para ter mais segurança ao trabalhar com números?
22
Planilhas http://goo.gl/lZzUU9
24
Obrigado! tulio@escoladedados.orgtulio@escoladedados.org :: http://escoladedados.orghttp://escoladedados.org
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.