sexta-feira, 11 de junho de 2021

Valor de P e Nível de significância estatística

 


Quando um estudo é planejado, os autores objetivam responder uma pergunta de pesquisa, testando sua hipótese. A hipótese é uma suposição potencialmente verdadeira que é geralmente derivada de observações prévias ou estudos preliminares sobre um determinado assunto. As hipóteses podem ser sobre diferenças entre grupos ou associações.

Os pesquisadores sabem que não há como obter certeza se uma hipótese é verdadeira ou não, mesmo construindo e executando o estudo da forma mais transparente e acurada possível. Só existe uma maneira de obter certeza nos valores de uma população, quando analisamos o seu total, ou seja, 100%, todos os indivíduos. Geralmente, os estudos não analisam toda uma população, mas uma parte representativa da mesma, essa parte representativa é chamada de amostra. O problema é que, por mais que seja feito o cálculo do tamanho amostral para saber quantos indivíduos devem ser incluídos para que tenhamos um “n” representativo, os valores decorrentes da análise dessa amostra podem ser diferentes dos verdadeiros valores populacionais para a(s) variável(is) analisada(s), por simples obra do acaso (erro randômico). Com essa percepção do erro randômico, sabemos que todo resultado proveniente de uma amostra possui um grau de incerteza, assim, realizamos uma inferência do que seria o verdadeiro valor de populacional a partir da amostra. Desse modo, a estatística inferencial se torna uma grande ferramenta para a interpretação dos resultados obtidos, pois a análise dos dados nos oferece o grau de incerteza dos nossos resultados.

O exemplo abaixo envolve cálculos, porém não é preciso e nem se faz necessário decorar as fórmulas matemáticas para a compreensão do assunto, porém a apresentação a seguir tornará mais fácil o seu entendimento (eu acredito :) ).

Supondo que você jogue uma moeda honesta 10x, qual a probabilidade de ocorrer 5 caras e 5 coroas?

Primeiro calculamos o número de combinações possíveis, conforme a fórmula abaixo.

Agora a probabilidade de serem sorteadas 5 caras e 5 coroas.



A probabilidade de ocorrência de 5 caras e 5 coroas em 10 lançamentos de uma moeda não viciada é de 0,25 ou 25%.

Distribuição de probabilidade em 10 lançamentos de um moeda honesta

n° de caras

probabilidades

porcentagem

0

0,01

0,1

1

0,010

1,0

2

0,045

4,5

3

0,117

11,7

4

0,205

20,5

5

0,246

24,6

6

0,205

20,5

7

0,117

11,7

8

0,045

4,5

9

0,010

1,0


Observe que, os valores com maior probabilidade de ocorrer (mais frequentes) estão localizados no centro da distribuição e os valores menos frequentes, nos extremos (assemelhando a curva normal). Se pegarmos os valores de probabilidade para 7 ou mais caras ou para 3 ou menos coroas temos uma probabilidade total de 0,35 ou 35% essa probabilidade é o valor de P atribuído nessa distribuição. Mas o q ele representa? Representa a probabilidade daquele resultado ou mais extremo acontecer quando lançamos uma moeda honesta. Assim, a probabilidade de eu jogar uma moeda honesta 10 vezes e encontrar 7 ou mais caras ou 3 ou menos coroas é de 0,35 ou 35%.

Gráfico que representa a probabilidade do resultado ser “cara” em 10 lançamentos de uma moeda não viciada

Eixo vertical: probabilidade

Eixo horizontal: número de caras em 10 lançamentos


Portanto, o valor de P representa a probabilidade de encontrar o valor observado ou mais extremo, dado que a H0 é verdadeira. Na área da saúde, é consenso utilizar o valor de P como <0,05, isso significa que a probabilidade de termos encontrado aquele resultado observado é menor que 5%, considerando a H0 como verdadeira. 

Valor P


Agora vamos para uma situação na área da saúde.

Exemplo de ideia de pesquisa: Deseja-se verificar a influência do tabagismo materno durante a gravidez, no peso do recém-nascido.

Pergunta de pesquisa a partir dessa ideia:

Será que o do tabagismo materno durante a gravidez interfere no peso do recém-nascido?

Para responder a essa pergunta, precisamos seguir os passos abaixo:

Passo 1: construir 2 hipóteses, a hipótese nula (H0) e a hipótese alternativa (H1).

A hipótese nula (H0) diz que não há interferência do tabagismo materno, durante a gestação, no peso do recém-nascido.

A hipótese alternativa (H1) diz que há interferência do tabagismo materno, durante a gestação, no peso do recém-nascido.

A H1 é a do pesquisador, a que ele acredita ser verdadeira e colocará à prova. Já a H0 é a hipótese que os testes estatísticos trabalham. Dessa forma, o teste estatístico irá rejeitar a H0 ou falhar em rejeitar a H0. Mas não confunda falhar em rejeitar a H0 com aceitar H0, são coisas diferentes!

Passo 2: determinar o nível de significância do teste estatístico

Toda pesquisa realizada com amostra possui um erro intrínseco, o chamado erro aleatório (grau de incerteza). Para visualização e análise dos dados considerando a incerteza, a estatística possui o conceito de nível de significância (que podemos interpretar como o máximo erro tolerável. Quanto maior ele for, maior a facilidade em rejeitar a H0. No caso de valores extremos, quando o nível de significância for 1 (100%) será impossível não rejeitar H0, no caso do nível de significância 0 (0%) será impossível rejeitar H0. Na área da saúde, costuma-se determinar o nível de significância como 5% ou 1%. Quando estamos falando de nível de significância estatística, não podemos deixar de mencionar 2 conceitos. O erro do tipo I e erro do tipo II.

Conjunto de valores que levará a rejeição da hipótese nula (região crítica)


O erro do tipo I é o erro de afirmar que há uma diferença, quando na verdade ela não existe.

O erro do tipo II é o erro de afirmar que não existe diferença quando na verdade ela existe.

 

O nível de significância mensura o erro do tipo I, pois ele quantifica a probabilidade de estarmos errados ao afirmar que existe uma diferença. Quando eu assumo um nível de significância de 5%, isso indica que eu assumo uma probabilidade de erro de 5% quando encontro uma diferença entre os grupos.

 

Passo 3:execução da pesquisa

Os pesquisadores escolheram de maneira aleatória, 200 bebês para analisar seu peso e o histórico de tabagismo das mães durante a gestação. Foi verificado que 44 das mães fumaram durante a gestação e 156 não fumaram, a diferença da média de peso entre bebês de mães não fumantes e fumantes foi de 208,4g (fumantes = 3,046g e não fumantes = 3,255,0g). 

Passo 4:análise dos dados

A análise estatista é feita. É gerado um valor de P de 0,012. O que isso quer dizer?

Antes de responder, atente-se que quando expliquei sobre o posicionamento do valor de P, coloquei a imagem de uma curva normal com a área de significância e sem significância. Mas agora, estamos diante de 2 grupos, consequentemente 2 distribuições de dados com 2 médias, para a variável peso, no caso, peso de recém nascidos, como mostra a figura abaixo:

Mas professor, com esse valor de P 0,012, como vou saber se há ou não há diferença estatística entre as médias dos grupos?

O processo é bem simples. As curvas normais dos grupos irão se interpenetrar (uma encostar na outra), resta saber em qual local dessa interpenetração as curvas irão, estatisticamente se tocar.

Veja que na imagem abaixo, as curvas se interpenetram dentro da região de significância estatística (5%), pois o valor de P encontrado (0,012) está dentro dos 5% estabelecido a priori, dessa forma, muito provavelmente as médias são diferentes. 



O valor de P = 0,012 indica que a probabilidade de um resultado tão diferente entre os dois grupos (208,4g ) ter aparecido, considerando a H0 verdadeira é de 1%. 

Dessa forma, vamos verificar se os grupos apresentam diferença estatística.

Voltamos ao nível de significância (alfa) estabelecido como 5%. Observe que o valor de P encontrado é menor que o nível de significância estabelecido a priori. Assim sendo, consideramos que muito provavelmente houve diferença entre os grupos.




Dependendo da situação, pode-se assumir um nível de significância mais rigoroso de 1%. Caso esse nível de significância fosse o estabelecido ao invés dos 5%, a H0 não seria rejeitada, pois o valor de P obtido é foi maior que o nível de significância estabelecido.

Terminamos aqui uma postagem conceitual do valor de P. Porém, pelo motivo de que muitos livros, ao explicarem o valor de p, recorrerem a conceitos didáticos que fogem da definição real, a interpretação desse artifício estatístico fica deturpada, por exemplo, não podemos dizer que um tratamento é bom ou não apenas verificando o valor de P, mas isso é assunto para postagens futuras. Até lá!


Nenhum comentário:

Postar um comentário

Falácias comuns sobre o valor de P

  Vimos na publicação anterior o que representa o valor de P. A probabilidade de encontrar um resultado ou mais extremo, considerando a H0 c...