ESTAT0078 – Inferência I
Prof. Dr. Sadraque E. F. Lucena
sadraquelucena@academico.ufs.br
http://sadraquelucena.github.io/inferencia1
Seja \(X\) uma variável aleatória com função de densidade (ou de probabilidade) de parâmetro \(\theta\), denotada por \(f(x|\theta)\), e que não conhecemos o valor de \(\theta\) que representa a distribuição de \(X\).
Chamamos de inferência estatística o problema que consiste em especificar um ou mais valores para \(\theta\), com base em uma amostra de valores observados de \(X\).
O conjunto de valores de uma característica observável associada a uma coleção de indivíduos ou objetos de interesse é dito ser uma população.
Exemplos:
Qualquer parte (ou subconjunto) de uma população. A amostra é composta por \(n\) valores observados de uma característica de interesse, representados por variáveis aleatórias \(X_1, \ldots, X_n\). Ela é utilizada para fazer inferências sobre a população da qual foi retirada.
Exemplos:
Um conjunto de 1.000 transações de cartão de crédito realizadas em um país durante o ano de 2023.
Uma amostra de 500 segurados de uma companhia de seguros de saúde.
Quantidade numérica que caracteriza uma determinada população.
Exemplo: Na distribuição normal \(N(\mu, \sigma^2)\), os parâmetros são
\(\mu\) (média)
\(\sigma^2\) (variância).
Conjunto de todos os valores possíveis que os parâmetros de um modelo estatístico podem assumir.
Exemplo: Para a distribuição \(N(\mu, \sigma^2)\), o espaço paramétrico é dado por \[ \Theta = \{(\mu,\sigma^2): -\infty<\mu<\infty, \sigma^2>0\}. \]
Qualquer função \(\widehat{\theta} = T(X_1, \ldots,X_n)\) da amostra que não depende de parâmetros desconhecidos é denominada uma .
Exemplos:
Se \(\theta\) é um parâmetro de interesse e \(\Theta\) é o espaço paramétrico que define todos os valores possíveis que \(\theta\) pode assumir, então qualquer estatística que assuma valores dentro de \(\Theta\) pode ser considerada um estimador para o parâmetro \(\theta\).
Geralmente o estimador é denotado por uma letra grega com um chapéu (^) em cima, como em \(\hat{\theta}\).
A ideia por trás de um estimador é que ele fornece uma aproximação do valor verdadeiro do parâmetro com base nas observações da amostra.
Exemplos:
Se \(\mu\) é a média de uma população, um estimador comum para \(\mu\) é a média amostral \(\hat{\mu} = \frac{1}{n} \sum_{i=1}^{n} X_i\).
Se \(\sigma^2\) é a variância de uma população, um estimador para \(\sigma^2\) é a variância amostral \(s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \hat{\mu})^2\).
Qualquer estatística que assuma valores no conjunto dos possíveis valores de \(g(\theta)\) é um estimador para \(g(\theta)\).
Exemplo:
Considere que \(\theta\) seja a média de uma população, e queremos estimar uma função dessa média, especificamente \(g(\theta)=\theta^2\).
Fonte: https://slideplayer.com.br/slide/10934372/
Uma amostra aleatória de tamanho \(n\) obtida de uma população \(X\) pode ser entendida como um conjunto de variáveis aleatórias, \(X_1, \ldots, X_n\), independentes e identicamente distribuídas com a mesma distribuição de \(X\).
Suponha que estamos interessados no número de mortes por acidente de trânsito em um fim de semana comum, que pode ser modelado por uma variável aleatória \(X\) com distribuição de Poisson e parâmetro \(\lambda\). A função de probabilidade da Poisson(\(\lambda\)) é \[ f(x;\lambda) = \frac{e^{-\lambda}\lambda^x}{x!}, ~x = 0, 1, 2, \ldots \]
Agora, considere que temos uma amostra aleatória de tamanho \(n\), \(X_1,\ldots,X_n\), obtida dessa distribuição de Poisson. Encontre a função de verossimilhança, \(L(\lambda;\underset{\widetilde{\phantom{a}}}{x})\), dessa amostra aleatória.
Imagine que uma empresa quer entender o cancelamento de assinaturas do seu serviço. A equipe de ciência de dados modela se um cliente cancela a assinatura como uma variável aleatória \(X\) com distribuição de Bernoulli de parâmetro \(p\), onde \(p\) é a probabilidade de um cliente manter a assinatura. A função de probabilidade da Bernoulli(\(p\)) é: \[ f(x;p) = p^x (1-p)^{1-x}, \quad x = 0, 1. \] Aqui, \(X=1\) indica que o cliente manteve a assinatura, e \(X=0\) indica que o cliente cancelou. Considere uma amostra aleatória de tamanho \(n\), \(X_1,\ldots,X_n\), obtida dessa distribuição de Bernoulli. Determine a função de verossimilhança, \(L(p;\underset{\widetilde{\phantom{a}}}{x})\), dessa amostra aleatória.
Pressuponha que o tempo de vida de um certo tipo de componente eletrônico, representado pela variável aleatória \(X\), tem distribuição Exponencial com parâmetro \(\alpha\). A função de densidade da Exponencial(\(\alpha\)) é: \[ f(x;\alpha) = \alpha e^{-\alpha x}, \quad x\geq 0. \]
Admita que uma amostra aleatória de tamanho \(n\), \(X_1,\ldots,X_n\), foi obtida dessa distribuição Exponencial. Determine a função de verossimilhança, \(L(p;\underset{\widetilde{\phantom{a}}}{x})\), para essa amostra aleatória.