Quando um estudo é planejado, os autores objetivam
responder uma pergunta de pesquisa, testando sua hipótese. A hipótese é uma
suposição potencialmente verdadeira que é geralmente derivada de observações prévias
ou estudos preliminares sobre um determinado assunto. As hipóteses podem ser
sobre diferenças entre grupos ou associações.
Os pesquisadores sabem que não
há como obter certeza se uma hipótese é verdadeira ou não, mesmo construindo e
executando o estudo da forma mais transparente e acurada possível. Só existe
uma maneira de obter certeza nos valores de uma população, quando analisamos o
seu total, ou seja, 100%, todos os indivíduos. Geralmente, os estudos não
analisam toda uma população, mas uma parte representativa da mesma, essa parte
representativa é chamada de amostra. O problema é que, por mais que seja feito
o cálculo do tamanho amostral para saber quantos indivíduos devem ser incluídos
para que tenhamos um “n” representativo, os valores decorrentes da análise dessa
amostra podem ser diferentes dos verdadeiros valores populacionais para a(s)
variável(is) analisada(s), por simples obra do acaso (erro randômico). Com essa
percepção do erro randômico, sabemos que todo resultado proveniente de uma
amostra possui um grau de incerteza, assim, realizamos uma inferência do que
seria o verdadeiro valor de populacional a partir da amostra. Desse modo, a
estatística inferencial se torna uma grande ferramenta para a interpretação dos
resultados obtidos, pois a análise dos dados nos oferece o grau de incerteza
dos nossos resultados.
O exemplo abaixo envolve
cálculos, porém não é preciso e nem se faz necessário decorar as fórmulas
matemáticas para a compreensão do assunto, porém a apresentação a seguir
tornará mais fácil o seu entendimento (eu acredito :) ).
Supondo que você jogue uma
moeda honesta 10x, qual a probabilidade de ocorrer 5 caras e 5 coroas?
Primeiro calculamos o número
de combinações possíveis, conforme a fórmula abaixo.
Agora a probabilidade de serem
sorteadas 5 caras e 5 coroas.
A probabilidade de ocorrência de 5 caras e 5 coroas em 10
lançamentos de uma moeda não viciada é de 0,25 ou 25%.
Distribuição de
probabilidade em 10 lançamentos de um moeda honesta
n° de
caras |
probabilidades |
porcentagem |
0 |
0,01 |
0,1 |
1 |
0,010 |
1,0 |
2 |
0,045 |
4,5 |
3 |
0,117 |
11,7 |
4 |
0,205 |
20,5 |
5 |
0,246 |
24,6 |
6 |
0,205 |
20,5 |
7 |
0,117 |
11,7 |
8 |
0,045 |
4,5 |
9 |
0,010 |
1,0 |
Observe que, os valores com maior probabilidade de
ocorrer (mais frequentes) estão localizados no centro da distribuição e os
valores menos frequentes, nos extremos (assemelhando a curva normal). Se
pegarmos os valores de probabilidade para 7 ou mais caras ou para 3 ou menos
coroas temos uma probabilidade total de 0,35 ou 35% essa probabilidade é o valor
de P atribuído nessa distribuição. Mas o q ele representa? Representa a
probabilidade daquele resultado ou mais extremo acontecer quando lançamos uma
moeda honesta. Assim, a probabilidade de eu jogar uma moeda honesta 10 vezes e encontrar 7 ou mais caras ou 3 ou menos coroas é de 0,35 ou 35%.
Gráfico que representa a probabilidade do resultado ser “cara”
em 10 lançamentos de uma moeda não viciada
Eixo vertical: probabilidade
Eixo horizontal: número
de caras em 10 lançamentos
Portanto, o valor de P representa a probabilidade de encontrar o valor observado ou mais extremo, dado que a H0 é verdadeira. Na área da saúde, é consenso utilizar o valor de P como <0,05, isso significa que a probabilidade de termos encontrado aquele resultado observado é menor que 5%, considerando a H0 como verdadeira.
Valor P
Agora vamos para uma situação na
área da saúde.
Exemplo de ideia de pesquisa:
Deseja-se verificar a influência do tabagismo materno durante a gravidez, no
peso do recém-nascido.
Pergunta de pesquisa a partir
dessa ideia:
Será
que o do tabagismo materno durante a gravidez interfere no peso do
recém-nascido?
Para responder a essa
pergunta, precisamos seguir os passos abaixo:
Passo 1: construir
2 hipóteses, a hipótese nula (H0) e a hipótese alternativa (H1).
A hipótese nula (H0) diz que não há interferência do
tabagismo materno, durante a gestação, no peso do recém-nascido.
A hipótese alternativa (H1)
diz que há interferência do tabagismo materno, durante a gestação, no peso do
recém-nascido.
A H1 é a do pesquisador, a que
ele acredita ser verdadeira e colocará à prova. Já a H0 é a hipótese que os
testes estatísticos trabalham. Dessa forma, o teste estatístico irá rejeitar a
H0 ou falhar em rejeitar a H0. Mas não confunda falhar em rejeitar a H0 com
aceitar H0, são coisas diferentes!
Passo 2: determinar o nível de
significância do teste estatístico
Toda pesquisa realizada com amostra possui um erro intrínseco,
o chamado erro aleatório (grau de incerteza). Para visualização e análise dos
dados considerando a incerteza, a estatística possui o conceito de nível de
significância (que podemos interpretar como o máximo erro
tolerável. Quanto maior ele for, maior a facilidade em rejeitar a H0. No caso
de valores extremos, quando o nível de significância for 1 (100%) será
impossível não rejeitar H0, no caso do nível de significância 0 (0%) será impossível
rejeitar H0. Na área da saúde, costuma-se determinar o nível de significância
como 5% ou 1%. Quando estamos falando de nível de significância estatística,
não podemos deixar de mencionar 2 conceitos. O erro do tipo I e erro do tipo
II.
Conjunto de
valores que levará a rejeição da hipótese nula (região crítica)
O erro do tipo I é o erro de afirmar que há uma diferença,
quando na verdade ela não existe.
O erro do tipo II é o erro de afirmar que não existe
diferença quando na verdade ela existe.
O nível de significância mensura o erro do tipo I, pois
ele quantifica a probabilidade de estarmos errados ao afirmar que existe uma
diferença. Quando eu assumo um nível de significância de 5%, isso indica que eu
assumo uma probabilidade de erro de 5% quando encontro uma diferença entre os
grupos.
Passo 3:execução da pesquisa
Os pesquisadores escolheram de
maneira aleatória, 200 bebês para analisar seu peso e o histórico de tabagismo
das mães durante a gestação. Foi verificado que 44 das mães fumaram durante a
gestação e 156 não fumaram, a diferença da média de peso entre bebês de mães
não fumantes e fumantes foi de 208,4g (fumantes = 3,046g e não fumantes =
3,255,0g).
Passo 4:análise dos dados
A análise estatista é feita. É
gerado um valor de P de 0,012. O que isso quer dizer?
Antes de responder, atente-se que
quando expliquei sobre o posicionamento do valor de P, coloquei a imagem de uma
curva normal com a área de significância e sem significância. Mas agora,
estamos diante de 2 grupos, consequentemente 2 distribuições de dados com 2
médias, para a variável peso, no caso, peso de recém nascidos, como mostra a
figura abaixo:
Mas professor, com esse valor
de P 0,012, como vou saber se há ou não há diferença estatística entre as
médias dos grupos?
O processo é bem simples. As
curvas normais dos grupos irão se interpenetrar (uma encostar na outra), resta
saber em qual local dessa interpenetração as curvas irão, estatisticamente se
tocar.
Veja que na imagem abaixo, as
curvas se interpenetram dentro da região de significância estatística (5%),
pois o valor de P encontrado (0,012) está dentro dos 5% estabelecido a priori,
dessa forma, muito provavelmente as médias são diferentes.
O valor de P = 0,012 indica que a probabilidade de um resultado tão diferente entre os dois grupos (208,4g ) ter aparecido, considerando a H0 verdadeira é de 1%.
Dessa forma, vamos verificar se os grupos apresentam diferença estatística.
Voltamos ao nível de significância (alfa) estabelecido como 5%. Observe que o valor de P encontrado é menor que o nível de significância estabelecido a priori. Assim sendo, consideramos que muito provavelmente houve diferença entre os grupos.
Dependendo da situação,
pode-se assumir um nível de significância mais rigoroso de 1%. Caso esse nível
de significância fosse o estabelecido ao invés dos 5%, a H0 não seria
rejeitada, pois o valor de P obtido é foi maior que o nível de significância
estabelecido.
Terminamos aqui uma postagem
conceitual do valor de P. Porém, pelo motivo de que muitos livros, ao
explicarem o valor de p, recorrerem a conceitos didáticos que fogem da
definição real, a interpretação desse artifício estatístico fica deturpada, por
exemplo, não podemos dizer que um tratamento é bom ou não apenas verificando o
valor de P, mas isso é assunto para postagens futuras. Até lá!
Nenhum comentário:
Postar um comentário