Seja \(\mathbf{X}=(X_1,\ldots,X_n)\) uma amostra aleatória de uma população com distribuição \(f_X(x;\theta)\), \(\theta\in\Theta\).
Hipóteses paramétricas
Hipótese nula: \(H_0:\theta\in\Theta_0\)
Hipótese alternativa: \(H_1:\theta\in\Theta_1\)
com \(\Theta=\Theta_0\cup\Theta_1\) e \(\Theta_0\cap\Theta_1=\varnothing\).
Tipos de hipóteses
Hipótese simples
Hipóteses compostas
\(H:\theta\neq\theta_0\)
\(H:\theta>\theta_0\) ou \(H:\theta\geq\theta_0\)
\(H:\theta<\theta_0\) ou \(H:\theta\leq\theta_0\)
Consideremos uma amostra observada de dimensão 30 com \(\bar{x}=s^2=11\) de uma população \(X\sim N(\mu,\sigma^2 = 9)\).
Pretende-se testar a hipótese de interesse \[H_0: \mu=10\] contra a alternativa \[H_1: \mu\neq10\]
Mais precisamente, pretende-se avaliar se a amostra observada contém informação que contrarie significativamente a hipótese de interesse.
Já usámos atrás a variável fulcral \[Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\]
Neste caso, isto quer dizer que \[Z=\frac{\bar{X}-\mu}{\frac{3}{\sqrt{30}}}\sim N(0,1),\] em que \(\mu\) representa o valor desconhecido da média da população.
Admitindo que \(H_0\) é verdadeira obtemos a estatística de teste:
\[Z_0=\frac{\bar{X}-10}{\frac{3}{\sqrt{30}}}\sim N(0,1)\]
Que valores de \(Z_0\) se deverão encarar com surpresa caso \(H_0\) seja verdadeira?
A resposta à pergunta anterior permite estabelecer a forma da região crítica (ou região de rejeição de \(H_0\)), \(RC\subset\mathbb{R}\), que é definida completamente de forma que \[P(Z_0\in RC\mid H_0)\leq\alpha,\] em que \(\alpha\) é uma probabilidade, em geral pequena, a que se chama o nível de significância do teste.
Para um nível de significância \(\alpha=0.05\) obtem-se a região crítica:
\[RC_{0.05}=\left]-\infty, -1.96\right[\ \cup\ \left]1.96, +\infty\right[,\]
ou, equivalentemente, a regra de decisão:
Rejeitar \(H_0\) para \(\alpha=0.05\) se \(|Z_0|>1.96\);
Não rejeitar \(H_0\) para \(\alpha=0.05\) no caso contrário.
Para a amostra observada tem-se \[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\notin RC_{0.05},\] e, portanto, não se rejeita \(H_0\) ao nível de significância de 0.05 (ou menor).
Nota
Para as hipóteses consideradas, o teste de hipóteses aplicado é equivalente a averiguar se o valor 10 está ou não incluído no \(IC_{0.95}(\mu)\).
\[|z_0|\leq 1.96 \iff \left|\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}\right|\leq 1.96\iff\]
\[\iff \bar{x}-1.96\frac{\sigma}{\sqrt{n}}\leq \mu_0\leq \bar{x}+1.96\frac{\sigma}{\sqrt{n}}\]
Estatística de teste
Escolha de uma estatística de teste adequada \(T(\mathbf{X})\) cuja distribuição sob \(H_0\) seja conhecida e que, de alguma forma, permita avaliar o grau de discordância entre os dados e a hipótese \(H_0\).
Região crítica ou de rejeição de \(H_0\)
Admitindo que \(H_0\) é verdadeira, define-se uma região \(C\subset\mathbb{R}\) tal que a \(P(T(\mathbf{X})\in C\mid H_0)\leq\alpha\), em que \(\alpha\) é uma probabilidade, em geral pequena, a que se chama o nível de significância do teste.
Concretização do teste de hipóteses
Observada uma amostra \(\mathbf{x}=(x_1,\ldots,x_n)\) calcula-se \(T(\mathbf{x})\) e é tomada uma decisão:
Avaliação de um teste de hipóteses
Numa decisão sobre uma hipótese \(H_0\) há dois erros possíveis:
Erro de tipo I: rejeitar \(H_0\) quando \(H_0\) é verdadeira
Erro de tipo II: não rejeitar \(H_0\) quando \(H_0\) é falsa
As respetivas probabilidades são:
\(\begin{split} \alpha(\theta) & =P(\text{rejeitar}\, H_0\mid H_0\, \text{verdadeira}) \\[0.25cm] & =P(T(\mathbf{X})\in C\mid \theta\in\Theta_0) \end{split}\)
\(\begin{split} \beta(\theta) & =P(\text{não rejeitar}\, H_0\mid H_0\, \text{falsa}) \\[0.25cm] & =P(T(\mathbf{X})\notin C\mid \theta\in\Theta_1) \end{split}\)
A potência de um teste de hipóteses é definida por \[P(\mathrm{rejeitar}\, H_0\mid \theta)=\left\lbrace \begin{array}{ll} \alpha(\theta), & \theta\in\Theta_0\\ 1-\beta(\theta), & \theta\in\Theta_1 \end{array} \right.\]
Uma vez que o teste foi definido à custa de
\[Z=\frac{\bar{X}-\mu}{\frac{3}{\sqrt{30}}}\sim N(0,1)\]
podemos avaliar as probabilidades de cada um dos erros:
\[\alpha = P(\text{Rejeitar }H_0\ \mid\ H_0\text{ verdadeira})\]
\[\beta(\mu) = P(\text{Não rejeitar }H_0\ \mid\ H_0\text{ falsa})\]
Como deve ser a função potência do teste ideal?
\(P(\text{Rejeitar }H_0\ \mid\mu)=\)
\(=P(|Z_0| > 1.96\ \mid\ \mu)=\)
\(=1-P(|Z_0|\leq\ 1.96\mid\mu)=\)
\(=1-\Phi\left(1.96+\frac{10-\mu}{\frac{3}{\sqrt{30}}}\right)+\Phi\left(-1.96+\frac{10-\mu}{\frac{3}{\sqrt{30}}}\right)\)
Nota
\(P(\text{Rejeitar }H_0\ \mid\mu=10)=0.05\)
Cálculo do valor-p
O valor-p é a probabilidade sob \(H_0\) de a estatística de teste tomar valores mais desfavoráveis a \(H_0\) do que o seu próprio valor observado.
Calculado o valor-p:
rejeita-se \(H_0\) para níveis de significância superiores ao valor-p;
não se rejeita no caso contrário.
Para a amostra observada tem-se
\[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\]
Valor-p = \(2(1-\Phi(1.826))=0.068\)
Apenas se deve rejeitar \(H_0\) para um nível de significância superior a 0.068.
Considere-se agora a hipótese de interesse
\[H_0: \mu\leq 10\] contra a alternativa \[H_1: \mu>10\]
Sob \(H_0\) a estatística de teste é a mesma:
\[Z_0=\frac{\bar{X}-10}{\frac{3}{\sqrt{30}}}\stackrel{\mu=10}{\sim} N(0,1)\]
Para um nível de significância \(\alpha=0.05\) obtem-se a região de rejeição de \(H_0\) ou região crítica:
\[RC_{0.05}=]1.645,+\infty[,\]
ou, equivalentemente, a regra de decisão:
Para a amostra observada tem-se \[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\in RC_{0.05},\] e, portanto, rejeita-se \(H_0\) ao nível de significância de 0.05.
O valor-p é, neste caso, dado por \(1-\Phi(1.826)=0.034\).
Apenas se deve rejeitar \(H_0\) para um nível de significância superior a 0.034.
Quando o valor de \(\sigma^2\) é também desconhecido passamos a usar a variável fulcral
\[ T=\sqrt{n}\frac{\bar{X}-\mu}{S}\sim t_{(n-1)}\]
A construção dos testes de hipóteses é inteiramente análoga aos casos anteriores.
Testes de hipóteses para a variância
Neste caso recorre-se à variável fulcral usada atrás para \(\sigma^2\)
\[Q=\frac{(n-1)S^2}{\sigma^2}\sim \chi_{(n-1)}^2\]
No entanto, pode-se pensar que a assimetria da distribuição da estatística de teste introduz novas dificuldades.
Consideremos a construção de um teste para as hipóteses \[H_0:\sigma^2=9\, \text{contra}\, H_1:\sigma^2\neq 9\]
A estatística de teste é
\[Q_0=\frac{29S^2}{9}\stackrel{\sigma^2=9}{\sim} \chi_{(29)}^2\]
Qual deverá ser a forma da região crítica?
Sob \(H_0\) é de esperar que a estatística tome valores em torno de \(E[Q_0]=29\). Logo, valores que se afastem dessa medida de localização da distribuição \(\chi_{(29)}^2\), quer para valores elevados quer para valores próximos de 0, fornecem evidência contra a hipótese nula, ou seja,
\[RC_{\alpha}=\left[0, F_{\chi_{(29)}^2}^{-1}(\alpha/2)\right[ \cup \left]F_{\chi_{(29)}^2}^{-1}(1-\alpha/2),+\infty\right[\]
Para \(\alpha=0.01\) tem-se
\[RC_{0.01}=\left[0, 13.121\right[ \cup \left]52.336,+\infty\right[,\]
\(q_0=35.444\notin RC_{0.01}\) e, portanto, não se rejeita \(H_0\) ao nível de significância de 0.01.
O valor-p é dado por
\[2\times \min\{P(Q_0\leq 35.444),\ P(Q_0>35.444)\}= 0.381\]
Testes de hipóteses em populações não normais uniparamétricas
Tal como na construção de intervalos de confiança, também aqui só iremos considerar testes de hipóteses aproximados baseados em estatísticas de teste obtidas pela aplicação do Teorema do Limite Central, ou seja,
\[\frac{\bar{X}-E[X]}{\sqrt{\frac{Var[X]}{n}}}\stackrel{a}{\sim}N(0,1),\] para \(n\) suficientemente grande.
Haja luz!
Um fabricante de lâmpadas afirma que o tempo médio de vida das suas lâmpadas é de \(1000 (= 10^3)\) horas, no mínimo. Numa amostra de 120 lâmpadas retiradas ao acaso da produção desse fabricante observou-se um tempo total de vida de \(112\times 10^3\) horas.
Admitindo que o tempo de vida de uma lâmpada, em milhares de horas, segue uma distribuição exponencial, pretende-se avaliar a afirmação do fabricante.
Seja \(\mathbf{X}=(X_1,\ldots,X_n)\) uma amostra aleatória de uma população com distribuição \(Exp(\lambda)\), \(\lambda>0\).
Hipóteses
\(H_0:1/\lambda\geq 1\) contra \(H_1:1/\lambda< 1\)
Estatística de teste
Como a dimensão da amostra é suficientemente grande podemos utilizar
\[T_0=\sqrt{n}\left(\bar{X}-1\right)\stackrel{a}{\sim}N(0,1),\]
Região crítica
Tendo em conta as hipóteses e a estatística de teste, a região crítica deverá ter a forma
\[RC_{\alpha}=\left]-\infty, \Phi^{-1}\left( \alpha\right) \right[\]
Assim o valor-p é dado por \(P(T_0\leq t_0)\).
Concretização do teste de hipóteses
Como \(\sum_{i=1}^{120}x_i=112\) tem-se \(t_0=\sqrt{120}\left(\frac{112}{120}-1\right)\simeq -0.73\).
O valor-p é igual a \(P(T_0\leq -0.73)\simeq 1-\Phi(0.73)=1-0.7673=0.2327\).
Conclusões
deve-se rejeitar \(H_0\) para níveis de significância superiores a 0.2327 e não rejeitar no caso contrário;
não há evidência suficiente para rejeitar a afirmação do fabricante de lâmpadas aos níveis de significância mais usuais \((\alpha \in[0.01,0.1])\).