Testes de hipóteses

Nos dois capítulos anteriores vimos como usar os dados observados para determinar um valor ou um conjunto de valores plausíveis para um parâmetro cujo valor numa população é desconhecido.

Agora o procedimento inverte-se: escolhido um valor ou um conjunto de valores possíveis para um parâmetro, vamos avaliar se os dados observados contrariam ou não essa escolha.
Por fim, iremos analisar uma questão de uma natureza diferente – o ajustamento de uma distribuição a uma variável aleatória.

8.1 Testes de hipóteses paramétricas

Seja \(\mathbf{X}=(X_1,\ldots,X_n)\) uma amostra aleatória de uma população com distribuição \(f_X(x;\theta)\), \(\theta\in\Theta\).

Hipóteses paramétricas

Hipótese nula: \(H_0:\theta\in\Theta_0\)

Hipótese alternativa: \(H_1:\theta\in\Theta_1\)

com \(\Theta=\Theta_0\cup\Theta_1\) e \(\Theta_0\cap\Theta_1=\varnothing\).

Tipos de hipóteses

Hipótese simples

\(H:\theta=\theta_0\)

Hipóteses compostas

\(H:\theta\neq\theta_0\)
\(H:\theta>\theta_0\) ou \(H:\theta\geq\theta_0\)
\(H:\theta<\theta_0\) ou \(H:\theta\leq\theta_0\)

Consideremos uma amostra observada de dimensão 30 com \(\bar{x}=s^2=11\) de uma população \(X\sim N(\mu,\sigma^2 = 9)\).

Pretende-se testar a hipótese de interesse \[H_0: \mu=10\] contra a alternativa \[H_1: \mu\neq10\]

Mais precisamente, pretende-se avaliar se a amostra observada contém informação que contrarie significativamente a hipótese de interesse.

Já usámos atrás a variável fulcral \[Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\]

Neste caso, isto quer dizer que \[Z=\frac{\bar{X}-\mu}{\frac{3}{\sqrt{30}}}\sim N(0,1),\] em que \(\mu\) representa o valor desconhecido da média da população.

Admitindo que \(H_0\) é verdadeira obtemos a estatística de teste:

\[Z_0=\frac{\bar{X}-10}{\frac{3}{\sqrt{30}}}\sim N(0,1)\]

Que valores de \(Z_0\) se deverão encarar com surpresa caso \(H_0\) seja verdadeira?

A resposta à pergunta anterior permite estabelecer a forma da região crítica (ou região de rejeição de \(H_0\)), \(RC\subset\mathbb{R}\), que é definida completamente de forma que \[P(Z_0\in RC\mid H_0)\leq\alpha,\] em que \(\alpha\) é uma probabilidade, em geral pequena, a que se chama o nível de significância do teste.

Para um nível de significância \(\alpha=0.05\) obtem-se a região crítica:

\[RC_{0.05}=\left]-\infty, -1.96\right[\ \cup\ \left]1.96, +\infty\right[,\]

ou, equivalentemente, a regra de decisão:

Rejeitar \(H_0\) para \(\alpha=0.05\) se \(|Z_0|>1.96\);
Não rejeitar \(H_0\) para \(\alpha=0.05\) no caso contrário.

Para a amostra observada tem-se \[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\notin RC_{0.05},\] e, portanto, não se rejeita \(H_0\) ao nível de significância de 0.05 (ou menor).

Nota

Para as hipóteses consideradas, o teste de hipóteses aplicado é equivalente a averiguar se o valor 10 está ou não incluído no \(IC_{0.95}(\mu)\).

\[|z_0|\leq 1.96 \iff \left|\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}\right|\leq 1.96\iff\]

\[\iff \bar{x}-1.96\frac{\sigma}{\sqrt{n}}\leq \mu_0\leq \bar{x}+1.96\frac{\sigma}{\sqrt{n}}\]

Estatística de teste

Escolha de uma estatística de teste adequada \(T(\mathbf{X})\) cuja distribuição sob \(H_0\) seja conhecida e que, de alguma forma, permita avaliar o grau de discordância entre os dados e a hipótese \(H_0\).

Região crítica ou de rejeição de \(H_0\)

Admitindo que \(H_0\) é verdadeira, define-se uma região \(C\subset\mathbb{R}\) tal que a \(P(T(\mathbf{X})\in C\mid H_0)\leq\alpha\), em que \(\alpha\) é uma probabilidade, em geral pequena, a que se chama o nível de significância do teste.

Concretização do teste de hipóteses

Observada uma amostra \(\mathbf{x}=(x_1,\ldots,x_n)\) calcula-se \(T(\mathbf{x})\) e é tomada uma decisão:

se \(T(\mathbf{x})\in C\) rejeita-se \(H_0\) para o nível de significância \(\alpha\);
caso contrário não se rejeita \(H_0\) para o mesmo nível de significância \(\alpha\).

Avaliação de um teste de hipóteses

Numa decisão sobre uma hipótese \(H_0\) há dois erros possíveis:

Erro de tipo I: rejeitar \(H_0\) quando \(H_0\) é verdadeira

Erro de tipo II: não rejeitar \(H_0\) quando \(H_0\) é falsa

As respetivas probabilidades são:

\(\begin{split} \alpha(\theta) & =P(\text{rejeitar}\, H_0\mid H_0\, \text{verdadeira}) \\[0.25cm] & =P(T(\mathbf{X})\in C\mid \theta\in\Theta_0) \end{split}\)

\(\begin{split} \beta(\theta) & =P(\text{não rejeitar}\, H_0\mid H_0\, \text{falsa}) \\[0.25cm] & =P(T(\mathbf{X})\notin C\mid \theta\in\Theta_1) \end{split}\)

A potência de um teste de hipóteses é definida por \[P(\mathrm{rejeitar}\, H_0\mid \theta)=\left\lbrace \begin{array}{ll} \alpha(\theta), & \theta\in\Theta_0\\ 1-\beta(\theta), & \theta\in\Theta_1 \end{array} \right.\]

Uma vez que o teste foi definido à custa de

\[Z=\frac{\bar{X}-\mu}{\frac{3}{\sqrt{30}}}\sim N(0,1)\]

podemos avaliar as probabilidades de cada um dos erros:

\[\alpha = P(\text{Rejeitar }H_0\ \mid\ H_0\text{ verdadeira})\]

\[\beta(\mu) = P(\text{Não rejeitar }H_0\ \mid\ H_0\text{ falsa})\]

Como deve ser a função potência do teste ideal?

\(P(\text{Rejeitar }H_0\ \mid\mu)=\)

\(=P(|Z_0| > 1.96\ \mid\ \mu)=\)

\(=1-P(|Z_0|\leq\ 1.96\mid\mu)=\)

\(=1-\Phi\left(1.96+\frac{10-\mu}{\frac{3}{\sqrt{30}}}\right)+\Phi\left(-1.96+\frac{10-\mu}{\frac{3}{\sqrt{30}}}\right)\)

Nota

\(P(\text{Rejeitar }H_0\ \mid\mu=10)=0.05\)

Cálculo do valor-p

O valor-p é a probabilidade sob \(H_0\) de a estatística de teste tomar valores mais desfavoráveis a \(H_0\) do que o seu próprio valor observado.

Calculado o valor-p:

rejeita-se \(H_0\) para níveis de significância superiores ao valor-p;
não se rejeita no caso contrário.

Para a amostra observada tem-se

\[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\]

Valor-p = \(2(1-\Phi(1.826))=0.068\)

Apenas se deve rejeitar \(H_0\) para um nível de significância superior a 0.068.

Considere-se agora a hipótese de interesse

\[H_0: \mu\leq 10\] contra a alternativa \[H_1: \mu>10\]

Sob \(H_0\) a estatística de teste é a mesma:

\[Z_0=\frac{\bar{X}-10}{\frac{3}{\sqrt{30}}}\stackrel{\mu=10}{\sim} N(0,1)\]

Para um nível de significância \(\alpha=0.05\) obtem-se a região de rejeição de \(H_0\) ou região crítica:

\[RC_{0.05}=]1.645,+\infty[,\]

ou, equivalentemente, a regra de decisão:

Rejeitar \(H_0\) para \(\alpha=0.05\) se \(Z_0>1.645\);
Não rejeitar \(H_0\) para \(\alpha=0.05\) no caso contrário.

Para a amostra observada tem-se \[z_0=\frac{11-10}{\frac{3}{\sqrt{30}}}=1.826\in RC_{0.05},\] e, portanto, rejeita-se \(H_0\) ao nível de significância de 0.05.

O valor-p é, neste caso, dado por \(1-\Phi(1.826)=0.034\).

Apenas se deve rejeitar \(H_0\) para um nível de significância superior a 0.034.

Quando o valor de \(\sigma^2\) é também desconhecido passamos a usar a variável fulcral

\[ T=\sqrt{n}\frac{\bar{X}-\mu}{S}\sim t_{(n-1)}\]

A construção dos testes de hipóteses é inteiramente análoga aos casos anteriores.

Testes de hipóteses para a variância

Neste caso recorre-se à variável fulcral usada atrás para \(\sigma^2\)

\[Q=\frac{(n-1)S^2}{\sigma^2}\sim \chi_{(n-1)}^2\]

No entanto, pode-se pensar que a assimetria da distribuição da estatística de teste introduz novas dificuldades.

Consideremos a construção de um teste para as hipóteses \[H_0:\sigma^2=9\, \text{contra}\, H_1:\sigma^2\neq 9\]

A estatística de teste é

\[Q_0=\frac{29S^2}{9}\stackrel{\sigma^2=9}{\sim} \chi_{(29)}^2\]

Qual deverá ser a forma da região crítica?

Sob \(H_0\) é de esperar que a estatística tome valores em torno de \(E[Q_0]=29\). Logo, valores que se afastem dessa medida de localização da distribuição \(\chi_{(29)}^2\), quer para valores elevados quer para valores próximos de 0, fornecem evidência contra a hipótese nula, ou seja,

\[RC_{\alpha}=\left[0, F_{\chi_{(29)}^2}^{-1}(\alpha/2)\right[ \cup \left]F_{\chi_{(29)}^2}^{-1}(1-\alpha/2),+\infty\right[\]

Para \(\alpha=0.01\) tem-se

\[RC_{0.01}=\left[0, 13.121\right[ \cup \left]52.336,+\infty\right[,\]

\(q_0=35.444\notin RC_{0.01}\) e, portanto, não se rejeita \(H_0\) ao nível de significância de 0.01.

O valor-p é dado por

\[2\times \min\{P(Q_0\leq 35.444),\ P(Q_0>35.444)\}= 0.381\]

Testes de hipóteses em populações não normais uniparamétricas

Tal como na construção de intervalos de confiança, também aqui só iremos considerar testes de hipóteses aproximados baseados em estatísticas de teste obtidas pela aplicação do Teorema do Limite Central, ou seja,

\[\frac{\bar{X}-E[X]}{\sqrt{\frac{Var[X]}{n}}}\stackrel{a}{\sim}N(0,1),\] para \(n\) suficientemente grande.

Haja luz!

Um fabricante de lâmpadas afirma que o tempo médio de vida das suas lâmpadas é de \(1000 (= 10^3)\) horas, no mínimo. Numa amostra de 120 lâmpadas retiradas ao acaso da produção desse fabricante observou-se um tempo total de vida de \(112\times 10^3\) horas.

Admitindo que o tempo de vida de uma lâmpada, em milhares de horas, segue uma distribuição exponencial, pretende-se avaliar a afirmação do fabricante.

Seja \(\mathbf{X}=(X_1,\ldots,X_n)\) uma amostra aleatória de uma população com distribuição \(Exp(\lambda)\), \(\lambda>0\).

Hipóteses

\(H_0:1/\lambda\geq 1\) contra \(H_1:1/\lambda< 1\)

Estatística de teste

Como a dimensão da amostra é suficientemente grande podemos utilizar

\[T_0=\sqrt{n}\left(\bar{X}-1\right)\stackrel{a}{\sim}N(0,1),\]

Região crítica

Tendo em conta as hipóteses e a estatística de teste, a região crítica deverá ter a forma

\[RC_{\alpha}=\left]-\infty, \Phi^{-1}\left( \alpha\right) \right[\]

Assim o valor-p é dado por \(P(T_0\leq t_0)\).

Concretização do teste de hipóteses

Como \(\sum_{i=1}^{120}x_i=112\) tem-se \(t_0=\sqrt{120}\left(\frac{112}{120}-1\right)\simeq -0.73\).

O valor-p é igual a \(P(T_0\leq -0.73)\simeq 1-\Phi(0.73)=1-0.7673=0.2327\).

Conclusões

deve-se rejeitar \(H_0\) para níveis de significância superiores a 0.2327 e não rejeitar no caso contrário;
não há evidência suficiente para rejeitar a afirmação do fabricante de lâmpadas aos níveis de significância mais usuais \((\alpha \in[0.01,0.1])\).

stylus_note ink_eraser delete_forever content_paste navigate_before navigate_next

draw

8 Testes de hipóteses

8.1 Testes de hipóteses paramétricas