ESTAT0078 – Inferência I
Prof. Dr. Sadraque E. F. Lucena
sadraquelucena@academico.ufs.br
http://sadraquelucena.github.io/inferencia1
Não podemos ter precisão infinita com orçamento finito. Definir o tamanho da amostra é a arte de equilibrar essa equação.
Um intervalo de confiança simétrico é dado por: \[\text{Estimativa} \pm \text{Margem de Erro}.\]
Toda fórmula para determinar \(n\) deriva da Margem de Erro (\(E\)) do Intervalo de Confiança.
O que fazemos e fixar o Erro e isolar \(n\).
Para uma população infinita ou muito grande, o IC é dado por \[IC = \overline{X} \pm E \quad \text{onde} \quad E = Z_{\alpha/2} \frac{\sigma}{\sqrt{n}}.\]
Isolando \(n\), temos: \[n = \left( \frac{z_{\alpha/2} \cdot \sigma}{E} \right)^2\]
Observe que na fórmula \(n\) é diretamente proporcional a \(\sigma^2\).
Ou seja, a necessidade de dados cresce com o quadrado da variabilidade.
Isto é, se a variância do fenômeno dobra, precisamos do dobro de dados. Se o desvio padrão dobra, precisamos de quatro vezes mais dados.
Implicação Atuarial: Carteiras de seguros com alta volatilidade (caudas pesadas) exigem bancos de dados muito grandes para que a estimativa da média seja confiável. Fenômenos estáveis exigem poucos dados.
Um auditor precisa estimar o valor médio das notas fiscais emitidas por uma empresa com erro máximo de R$ 5,00 e 95% de confiança. Um estudo piloto indicou um desvio padrão de R$ 50,00. Qual deve ser o tamanho de amostra que ele deve usar para estimar a média?
Uma fábrica de cabos de aço quer estimar a resistência média à ruptura. Sabe-se que \(\sigma = 300\) kgf. O engenheiro aceita um erro de 20 kgf, mas exige uma confiança altíssima de 99%. Qual deve ser o tamanho de amostra para estimar essa média?
Reflexão: Testes destrutivos são caros. Será que vale a pena subir de 95% para 99% e gastar muito mais material? Essa é a decisão gerencial.
\[n = \frac{Z_{\alpha/2}^2 \cdot p(1-p)}{E^2}\]
Temos dois caminhos para definir o valor de \(p\) na fórmula:
Cenário A: Informação Prévia - Temos uma pesquisa antiga ou estudo similar que indicou \(p \approx 0,20\). - Usamos esse valor na fórmula.
Cenário B: Sem Informação (Estimativa Conservadora) - Não sabemos nada sobre \(p\). - Assumimos o pior cenário de variância. - A variância \(p(1-p)\) é máxima quando \(p = 0,\!5\) (\(0,\!5 \times 0,\!5 = 0,25\)).
Ao usar \(p=0,\!5\), garantimos o tamanho de amostra máximo necessário.
\[n_{\text{cons}} = \frac{Z_{\alpha/2}^2 \cdot 0,25}{E^2}\quad\text{ou}\quad n_{\text{cons}}=\frac{Z_{\alpha/2}^2}{4 \,E^2}\]
Um instituto vai realizar uma pesquisa em uma cidade onde não há histórico de intenção de votos. Deseja-se uma margem de erro de 3% (0,03) com 95% de confiança. Qual deve ser o número de eleitores entrevistados?
Uma fábrica de peças automotivas quer estimar a proporção de peças defeituosas. O histórico mostra que a taxa de defeitos nunca passou de 10% (\(p \approx 0,10\)). Qual deve ser o tamanho de amostra para se ter um erro máximo de 2% com 95% de confiança?
| Parâmetro | Ação | Efeito em \(n\) | Natureza |
|---|---|---|---|
| Erro (\(E\)) | Reduzir (mais precisão) | Aumenta (\(\uparrow \uparrow\)) | Quadrática (inversa) |
| Confiança | Aumentar (95% \(\to\) 99%) | Aumenta (\(\uparrow\)) | Não-linear |
| Variância | Aumentar (mais ruído) | Aumenta (\(\uparrow\)) | Linear (com \(\sigma^2\)) |
Regra de Bolso: Para reduzir o erro pela metade, você precisa quadruplicar o tamanho da amostra.
Tudo o que vimos assume população infinita (ou muito grande).
Se a população for pequena (ex: \(N < 10.000\)), aplicamos a Correção de População Finita: \[n_{\text{final}} = \frac{n}{1 + \frac{n - 1}{N}}\]
Isso reduz o tamanho da amostra necessário, pois a população se “esgota” conforme amostramos.
Regra de bolso: Essa fórmula deve ser usada quando \(n/N > 0,\!05\) (ou seja, se a amostra representa mais de 5% da população).
