ANÁLISE DE DADOS EM BIOLOGIA

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Estatística amintas paiva afonso.
Deve ser selecionado o modo
Analise de Regressão Parte 2.
CAPÍTULO 7 TESTE DE HIPÓTESE
CAPÍTULO 7 TESTE DE HIPÓTESE
A CARTOGRAFIA TEMÁTICA E A ESTATÍSTICA
ESTIMAÇÃO.
MB751 – Modelos de previsão
Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.
Estatística e Probabilidade
J. Landeira-Fernandez Ética e Ciência
Análise da Regressão múltipla: Inferência Revisão da graduação
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Estatística e Probabilidade
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Deve ser selecionado o modo
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
Aula 6 - Método não-experimental ou de seleção não-aleatória
Aula 5 - Método experimental ou de seleção aleatória
Introdução à Estatística
Aplicações Estatísticas uma rápida abordagem
Estatística e Probabilidade
Análise Descritiva de Dados
Modelagem Estatística
Professor Antonio Carlos Coelho
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
análise dos estimadores
Estimativas de grandezas cap 2. e cap 3 Média Desvio Padrão e Variância Definições importantes Distribuição Normal Teorema do limite central Hipóteses.
Regressão.
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
PESQUISA EM PSICOLOGIA
Aula 4 – Estatística- Conceitos básicos
Metodologia da Pesquisa em Ensino de Ciências I
Descrição Bivariada Comparando Duas Distribuições
Estatística Descritiva
ANOVA.
Testes de Hipóteses.
Distribuição Normal de Probabilidade
Análise de Variância (ANOVA)
ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera.
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Métodos Estatísticos Aplicados às Ciências Biológicas
ANÁLISE DE DADOS EM BIOLOGIA
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Métodos Estatísticos Aplicados às Ciências Biológicas - 11ª aula -
Regressão Linear Simples
Testes de Hipóteses.
Correlação e regressão
ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera.
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Módulo 1 Estatística Básica.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Aula 4 Bioestatística Probabilidade para variáveis aleatórias.
AULA 07 CORRELAÇÃO Igor Menezes.
AULA 11 – REGRESSÃO Parte I
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Teste de Hipótese Camilo Daleles Rennó
Critérios de Escolha dos Métodos Estatísticos
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera

Perspectiva sobre o mundo em que vivemos Em média... Análise de dados em Biologia CONTEXTUALIZAÇÃO Significado de dados Perspectiva sobre o mundo em que vivemos Em média... Avaliação de dados Padrões Mundo mutante – variabilidade, imprevisibilidade

Análise de dados em Biologia UM AVISO IMPORTANTE “Você pode capturar um fenômeno em uma malha lógica ou matemática. A lógica é a malha grossa, mas forte. A matemática é a malha fina, porém frágil. A matemática é uma forma bonita de embrulhar um problema, mas não pode reter sua essência, a não ser que ela tenha sido capturada na malha lógica DESDE O COMEÇO.” (Platt, 1964 apud Magnusson & Mourão, 2005)

Qual é a malha lógica para nós, biólogos? Análise de dados em Biologia Qual é a malha lógica para nós, biólogos? A BIOLOGIA

Variação entre indivíduos dentro de cada grupo? Análise de dados em Biologia Espécie 1 Espécie 2 Variação entre indivíduos dentro de cada grupo?

× Um mundo sem variabilidade 1 indivíduo = toda espécie Análise de dados em Biologia Um mundo sem variabilidade × 1 indivíduo = toda espécie 1 indivíduo = toda espécie

TÓPICOS BÁSICOS DE AMOSTRAGEM Análise de dados em Biologia TÓPICOS BÁSICOS DE AMOSTRAGEM Amostra Unidade amostral Universo amostral

Unidade amostral = objeto de estudo (1) Análise de dados em Biologia Unidade amostral = objeto de estudo (1) Medida do comprimento da perna Medida do comprimento do corpo DESCRITORES de objetos = VARIÁVEIS

Unidade amostral = objeto de estudo (2) Análise de dados em Biologia Unidade amostral = objeto de estudo (2) Número de espécies vegetais Número de indivíduos vegetais Altura da vegetação

VARIÁVEIS DEPENDENTES Análise de dados em Biologia DESCRITORES DE CARACTERÍSTICAS BIOLÓGICAS DE ORGANISMOS, POPULAÇÕES E COMUNIDADES OBJETOS DE ESTUDO VARIÁVEIS DEPENDENTES Dependentes do quê?

PERGUNTA DE SUA PESQUISA Análise de dados em Biologia Classificação de descritores (variáveis) Decorar não é o importante. Importante é saber qual tipo de descritor você utilizará no seu estudo e isso está diretamente ligado à PERGUNTA DE SUA PESQUISA Banco de dados

Censo Amostra Unidade amostral Análise de dados em Biologia estudo de um ou mais descritores de TODO conjunto de objetos de um universo amostral (população estatística) Censo Amostra estudo de um ou mais descritores de um SUBCONJUNTO de objetos de um universo amostral Unidade amostral objeto de estudo

Parâmetro × Estatística Análise de dados em Biologia Por que e como amostrar? Censo é factível? - Tempo - Tamanho do universo amostral - Recursos financeiros - Recursos humanos Parâmetro × Estatística Característica da população ou universo amostral Característica da amostra Confiabilidade dos dados = a estatística representa a população

Escolha aleatória (random) dos objetos Análise de dados em Biologia Amostra representativa Escolha aleatória (random) dos objetos Assegura que não haverá viés (bias) nos dados Separar em categorias não é escolha. Dentro de cada categoria os objetos devem ser escolhidos aleatoriamente.

DELINEAMENTO AMOSTRAL? Análise de dados em Biologia DELINEAMENTO AMOSTRAL? Delinear uma amostragem é coletar os dados de forma que você tenha boa chance de tomar uma boa decisão (Magnusson & Mourão, 2005)

MÉTODOS DE AMOSTRAGEM - Aleatório - Sistemático - Estratificado Análise de dados em Biologia MÉTODOS DE AMOSTRAGEM - Aleatório - Sistemático - Estratificado - Preferencial

TIPOS DE EXPERIMENTOS - Em laboratório - Em campo - Naturais Análise de dados em Biologia TIPOS DE EXPERIMENTOS - Em laboratório - Em campo - Naturais

Elaboração de idéias a partir de observação x raciocínio Análise de dados em Biologia Elaboração de idéias a partir de observação x raciocínio Objeto de estudo, objetivos Questões de trabalho: Simples: Há variação espacial ou temporal? Complexas: Qual o efeito do ambiente sobre a espécie? Muuuito complexas: Dado o ambiente X, como responderá a espécie Y? Formalização de hipóteses

Modelando o sistema de trabalho Análise de dados em Biologia FLUXOGRAMAS Modelando o sistema de trabalho

Exemplo Peixes Densidade de lagostins Poluição Fitoplancton Análise de dados em Biologia Exemplo Peixes Densidade de lagostins Poluição Fitoplancton - Direção do efeito - Hipótese de trabalho* - Premissas - Variável dependente - Variável independente Estudos científicos investigam uma, ou algumas vezes muitas, das flechas de um fluxograma.

Qual a forma e o tamanho do efeito? Análise de dados em Biologia O efeito existe? Qual a forma e o tamanho do efeito? Alterando as condições, o que ocorre?

A ESCALA Análise de dados em Biologia Estudar invertebrados em unidades amostrais de 100 km2??? O tamanho da unidade amostral DEVE dar condições ao pesquisador de responder às questões levantadas. O sistema de estudo depende do objeto.

Tabulação de dados Análise de dados em Biologia Que informações mostrar? Como são separadas? Exemplo: Número de refeições diárias de seis indivíduos separados pelo sexo.

Distribuições de frequência Análise de dados em Biologia Distribuições de frequência Mostram padrões de distribuição das medidas realizadas. Possibilitam inferir probabilidade de ocorrência de determinada medida.

Medidas de tendência central Análise de dados em Biologia Medidas de tendência central Resumem o conjunto de dados em uma única medida 1. Média (valor provável) = ∑xi / n = 3+2+1+5+3+4 / 6 = 18 / 6 = 3 2. Mediana (valor que divide a série em dois grupos iguais) Passo 1 – ordenar os valores (1, 2, 3, 3, 4, 5) Passo 2 – encontrar qual é o valor central: Conjuntos ímpares = n + 1 / 2 Cojuntos pares = média dos dois valores centrais – 3 + 3 / 2 = 3* 3. Moda – valor mais frequente de um conjunto de valores Moda (1, 2, 3, 3, 4, 5) = 3

Dispersão Análise de dados em Biologia Mede a variabilidade das medidas em torno da média 1. Amplitude Diferença entre o maior e menor valor = 1 – 5 = 4 2. Variância s2 = ∑ (xi - )2 / n – 1 = (3 - 3) 2 + (2 - 3) 2 + (1 – 3) 2 + (5 – 3) 2 + (3 – 3) 2 + (4 – 3) 2 = 0 + 1 + 4 + 4 + 0 + 1 = 10 / 5 = 2 3. Desvio padrão = 1,41 4. Coeficiente de variação CV = s / ( × 100 para porcentagem) = 1,41 / 3 = 0,47

A importância da soma de quadrados Análise de dados em Biologia A importância da soma de quadrados Variância populacional é um parâmetro da população que pode ser inferido a partir de uma estatística – a variância da amostra A soma de quadrados é o numerador da fórmula de variância MEDE A VARIABILIDADE QUE EXISTE NO CONJUNTO DE DADOS LEVANDO EM CONSIDERAÇÃO OS DESVIOS DE CADA OBSERVAÇÃO DA MÉDIA DA AMOSTRA UTILIZADA PARA COMPARAR MÉDIAS DE CONJUNTOS DE DADOS

Desenho amostral – distribuição das unidades amostrais Análise de dados em Biologia Desenho amostral – distribuição das unidades amostrais Mais um detalhe importante... - As medidas devem ser independentes umas das outras... Ausência de AUTOCORRELAÇÃO Abundância = 2 Abundância = 3 Abundância = 3

Daí a importância de definir a UNIDADE amostral/experimental Análise de dados em Biologia A unidade amostral é a menor unidade da amostra da onde se retiram as medidas. De um experimento é a menor unidade à qual se pode designar um tratamento qualquer. Daí a importância de definir a UNIDADE amostral/experimental Considere que um pesquisador queira estudar o efeito de fósforo em lagoas, pois acredita que mais fósforo pode ocasionar eutrofização. Como deveria pensar seu desenho amostral?

Implica em falta de independência das unidades amostrais. Análise de dados em Biologia AUTOCORRELAÇÃO é A correlação/relação de séries de observações ordenadas no espaço ou no tempo. Implica em falta de independência das unidades amostrais. Por que isso é importante? Se duas medidas são autocorrelacionadas, a média e a variação não estarão descritas adequadamente pelo tamanho amostral, pois parte da medida de uma unidade amostral é devida à correlação com outra unidade amostral.

Distribuições de frequências Análise de dados em Biologia Distribuições de frequências

Distribuição normal (de Gauss) Análise de dados em Biologia Distribuição normal (de Gauss) Histograma da distribuição de frequências de 100 valores aleatoriamente selecionados Histograma da distribuição de frequências de 10000 valores aleatoriamente selecionados

Propriedades da curva normal Análise de dados em Biologia Propriedades da curva normal Forma de sino; Simétrica em relação à perpendicular que passa pela média (μ); A média, a mediana e a moda são coincidentes; Tem dois pontos de inflexão, correspondendo a valores de x situados à distância de um desvio padrão (σ) acima e abaixo da média; A área sob a curva totaliza 1 ou 100%; Aproximadamente 68% dos valores de x situam-se entre os pontos (μ – σ) e (μ + σ); Aproximadamente 95% dos valores de x estão entre (μ – 2σ) e (μ + 2σ); Aproximadamente 99,7% dos valores de x estão entre (μ – 3σ) e (μ + 3σ). Carl Friedrich Gauss

Propriedades da curva normal Análise de dados em Biologia Propriedades da curva normal Média = -0,04048 Desvio-padrão = 1,08

Propriedades da curva normal - exemplo Análise de dados em Biologia Propriedades da curva normal - exemplo Alturas de 20 mulheres da Unochapecó coletadas em agosto de 2014. INDIVÍDUO ALTURA 1 155 2 160 3 4 5 6 7 162 8 163 9 164 10 165 11 12 167 13 14 168 15 16 170 17 171 18 172 19 175 20 178 Média = 165,5 cm Desvio-padrão = 5,8 cm 1. Em torno de 2/3 da população de mulheres da Unochapecó possuem valores de altura entre 165,5 – 5,8 e 165,5 + 5,8. Ou seja, entre 159.7 e 171.3 cm 2. Grande parte (~95%) das mulheres da Unochapecó possuem altura entre 165,5 – 11,6 e 165,5 + 11,6. Ou seja, entre 153,9 e 177,1 cm

Análise de dados em Biologia Exercícios Qual a probabilidade aproximada de que uma mulher da Unochapecó possua altura de 178 cm? Tomando-se as alturas medidas para os homens da Unochapecó, calcule a média e o desvio-padrão. Calcule os valores dos pontos nos quais as alturas cairão nos intervalos de 68%, 95% e 99,7%.

Significância estatística de um desvio Análise de dados em Biologia Significância estatística de um desvio Média = 0,04048 Média +/- 2 DP = 0,04048+1,08 = 2,200048 e 0,04048-1,08 = - 2,11995

Intervalo de desvios não-significativos = valores dentro dos 95% Análise de dados em Biologia Significância estatística de um desvio Intervalo de desvios não-significativos = valores dentro dos 95% Intervalo de desvios significativos = valores FORA dos 95% = região de significância (α)

Teorema do limite central Análise de dados em Biologia Teorema do limite central Exercício Após assistir ao vídeo sobre Teorema do limite central e ler o texto sobre a média das médias: Faça o cálculo de todas as médias possíveis para uma população Z = (20, 30, 40, 50); Monte uma tabela e um gráfico de distribuição de frequências dos valores das médias calculadas.

Hipótese científica (ou de trabalho) Análise de dados em Biologia Testes de hipóteses Hipótese científica (ou de trabalho) - É a expectativa do pesquisador a respeito do comportamento do seu sistema de estudo. Em geral, é declarada como uma diferença, ou como uma relação significativa. Hipótese estatística - São suposições sobre o valor dos parâmetros estatísticos nas populações.

Níveis de significância Análise de dados em Biologia Níveis de significância Significância é determinada pelo pesquisador e está relacionada com qual valor de um teste deve ser considerado extremo o suficiente para gerar uma diferença ou uma relação significativa entre variáveis. Está diretamente ligada à uma probabilidade de ERRO! Erro em que sentido? No sentido de que, em se tratando de AMOSTRAS, qualquer valor tem uma probabilidade associada. Quanto menor a probabilidade, maior a certeza de que o EFEITO pode se dever a uma diferença ou associação significativa. ERRO TIPO I – rejeitar uma hipótese nula quando ela é verdadeira. Nível de significância: α = 0,05. Significa que há 5% de chance de rejeitar erroneamente a hipótese nula. Pode-se viver com essa incerteza????

COMPARAÇÃO ENTRE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE DUAS MÉDIAS O que se quer testar? Se duas médias são diferentes ou não. De onde vêm essas médias? De amostras de duas populações. Teste t independente Pressupostos: independência, aleatoridade, normalidade. Hipótese nula: média1 = média2 Hipótese alternativa: média1 ≠ média2

COMPARAÇÃO ENTRE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE DUAS MÉDIAS 2. Teste t pareado Se diferencia do teste independente no sentido de que medidas não são independentes. Por exemplo, pode-se comparar as médias de pesos de duas pessoas antes e depois de um determinado tratamento. As pessoas são as mesmas, ou seja, não há independência. Pressupostos: normalidade, aleatoridade Hipótese nula: média1 = média2 Hipótese alternativa: média1 ≠ média2

COMPARAÇÃO ENTRE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE DUAS MÉDIAS Reportando os resultados Quando se comparam duas médias, deve-se reportar, nos resultados, que “a média da variável da população ‘A’ NÃO FOI/FOI significativamente diferente da média da variável da população ‘B’”. Logo em seguida, em parênteses, deve-se colocar - Teste-tgraus de liberdade = [valor do teste]; p = [valor] Exemplo: Teste-t(18) = 3,561; p = 0,03*. Essa informação diz que foi realizado um teste t para comparar duas médias de uma amostra com 20 observações (graus de liberdade + 2), que o valor do teste foi 3,561 e que esse valor foi significativo ao nível de 0,05. Em outras palavras, pode-se ter 97% (0,03) de certeza de que as duas médias são realmente diferentes. Nesse caso, rejeita-se a hipótese nula e aceita-se a alternativa. * Para valores menores que 0,01, reportar p < 0,01.

COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS 2. Teste F (Análise de variância – ANOVA) Pressupostos: independência, normalidade, aleatoridade, igualdade de variâncias Hipótese nula: médiax1 = médiax2 = médiax3 ... Hipótese alternativa: pelo menos uma média é diferente de outra Anova de um fator = uma variável qualitativa nominal (categórica) e uma variável quantitativa.

COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Partição da variância total Variação total = Variação entre categorias + variação dentro de categorias LÓGICA DO TESTE Se a variação entre as categorias é maior que dentro dos tratamentos, então há diferença entre elas. Observação: as categorias em uma ANOVA também são chamadas de tratamentos, principalmente em experimentos de laboratório.

Visualização gráfica da partição da variância total Análise de dados em Biologia Visualização gráfica da partição da variância total Média dentro Grande média

Tabela resumo dos resultados de uma ANOVA de um fator Análise de dados em Biologia Tabela resumo dos resultados de uma ANOVA de um fator Variação SQ (Soma de quadrados) GL (Graus de liberdade) QM (Quadrado médio) F P Entre SQT k – 1 SQT/(k – 1) SQT/SQE F (5%; k – 1, N - k) Dentro SQE N – k SQE/(N – k) Total N – 1 NÃO SE ASSUSTE!!! SQT = A soma de quadrados entre os tratamentos SQE = A soma de quadrados dentro dos tratamentos SQ = A soma de quadrados total k = número de categorias N = tamanho amostral (número total de observações) F = valor do teste P = probabilidade do teste sob a hipótese nula

COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Testando quem é diferente de quem... Caso se rejeite a hipótese nula de igualdade das médias, o teste F NÃO mostra quais médias são diferentes entre si. TESTE DE TUKEY Esse teste é realizado DEPOIS da ANOVA quando o resultado é significativo. A ANOVA mostra somente se há diferenças, mas não diz quem é diferente de quem! Infelizmente, o Excel NÃO realiza esse teste.

COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Reportando os resultados Quando se comparam mais que duas médias, deve-se reportar, nos resultados, que “a média da variável da população ‘A’ foi significativamente maior do que a média da variável da população ‘B’ e da população ‘C’, e a média da população ‘B’ também foi maior do que a média da população ‘C’”. Logo em seguida, em parênteses, deve-se colocar - Fgraus de liberdade entre, graus de liberdade dentro = [valor do teste]; p = [valor] Exemplo: F(2,39) = 16,256; p < 0,001*. Nesse caso, rejeita-se a hipótese nula e aceita-se a alternativa. OBSERVAÇÃO: para se saber quais médias são diferentes, se deve realizar o teste para comparação de médias depois da ANOVA. * Para valores menores que 0,01, reportar p < 0,01.

COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Análise de dados em Biologia COMPARAÇÃO ENTRE MAIS DE DUAS MÉDIAS Teste a posteriori para detectar quais grupos foram diferentes entre si. O mais “famoso”: Teste de Tukey: compara par a par cada tratamento e gera um valor de significância (o corte é o tradicional 0,05). ESSE TESTE NÃO É REALIZADO NO EXCEL.

Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 1 – Correlação linear simples Considere o seguinte cenário: uma pesquisadora deseja saber se há uma relação entre a variação na quantidade de umidade no solo ao longo de um período do ano e a precipitação naquele período. Para tanto, ela mediu a umidade do solo uma vez semanalmente durante dois meses e coletou os dados de precipitação na estação meteorológica da cidade de um dia antes da coleta da umidade. Os dados coletados foram os seguintes:

Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 1 – Correlação linear simples PRIMEIRO PASSO: GRÁFICO DE DISPERSÃO (aqui mostro como se faz, mas qualquer programa pode fazer pra você.

Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 1 – Correlação linear simples Coeficiente de correlação (r) (ou coeficiente de correlação de Pearson) Estatística que mede a INTENSIDADE da associação entre duas variáveis quantitativas VARIAÇÃO NO COEFICIENTE DE CORRELAÇÃO Varia entre -1 e +1 Valores negativos = quando uma variável aumenta, a outra diminui Valores positivos = as duas variáveis variam no mesmo sentido Teste de hipóteses H0: r = 0 (não há correlação entre as variáveis) H1: r ≠ 0 (há correlação entre as variáveis)

Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 1 – Correlação linear simples PADRÕES DE DISPERSÃO DOS DADOS E INTENSIDADE DA CORRELAÇÃO r = 0 r = -1 r = +1 r = 0,8 r = 0,6 r = 0,7 r Intensidade Nula 0 – 0,3 Fraca 0,3 – 0,6 Regular 06, - 0,9 Forte 1 Perfeita ATENÇÃO: “r” mede uma associação, não uma relação de CAUSA E EFEITO.

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples QUANDO USAR? Há razões para supor que EXISTE uma relação de CAUSA E EFEITO, ou seja, que uma das variáveis DETERMINA (explica) a outra variável (dependente), assim: Variável dependente ou resposta = Y Variável independente ou explicativa = X

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples RETA DE REGRESSÃO LINEAR A partir de dois conjunto de medidas (variáveis), se pode inferir uma reta que representará o VALOR ESPERADO de Y dado os valores de X. Assim: Y = a + bX, onde Y = variável dependente a = coeficiente linear (valor de Y quando X = 0) b = coeficiente angular (inclinação da reta, quanto Y varia para cada acréscimo de X) X = variável independente Essa função é vista na disciplina de Matemática do Ensino Médio...

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples O gráfico da função linear do COLÉGIO se fazia assim: X Y 10 1 8 2 6 3 4 5 Vamos montar esse gráfico no quadro!

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples COEFICIENTE DE DETERMINAÇÃO (R2) Mede a quantidade da variação em Y que é EXPLICADA – causa e efeito – por Y Varia entre 0 e +1 Teste de hipóteses H0: b = 0 (não existe influência de X em Y) H1: b ≠ 0 (há influência de X em Y)

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples HÁ INFLUÊNCIA DA PRECIPITAÇÃO SOBRE A UMIDADE DO SOLO? Vamos fazer a análise... Reportar os resultados: A variação na precipitação influencia significativamente a variação na umidade do solo (R2 = 0,87; F1,6 = 39,96; p < 0,01). Equação linear da reta Y = a + bX Y = -3,0039 + 0,861X

ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples Análise de dados em Biologia ASSOCIAÇÕES ENTRE VARIÁVEIS QUANTITATIVAS 2 –Regressão linear simples PREDIÇÃO (Mãe Dinah na ciência!) Qual o valor esperado de umidade no solo se chover 15 mm no dia anterior? E se tivermos MAIS de uma variável explicativa? A regressão linear pode ser facilmente estendida para acomodar mais de uma variável explicativa e passa a ser chamada REGRESSÃO LINEAR MÚLTIPLA.

TESTES NÃO-PARAMÉTRICOS Análise de dados em Biologia TESTES NÃO-PARAMÉTRICOS Teste-t = Teste de Mann-Whitney (W) ANOVA = Teste de Kruskal-Wallis Coeficiente de correlação de Pearson = Coeficiente de Spearman Testes de permutação