Parâmetros Estatísticos: Como Calcular?

Neste artigo vamos aprender a calcular os “parâmetros estatísticos”. A “Estatística” é um método matemático utilizado para estimar a previsão de acontecimentos futuros e explicar a frequência da ocorrência desses acontecimentos.

Todos os dias somos confrontados na comunicação social com sondagens. Os valores apresentados nessas sondagens são determinados por cálculo estatístico.

População e Amostra

Designa-se por “População” o conjunto dos elementos que se pretende estudar. No caso das sondagens a “População” a estudar é o conjunto dos “Cidadãos Eleitores”.

Uma “Amostra” é um conjunto de elementos retirados da “População”, sobre os quais irá incidir o cálculo dos “parâmetros estatísticos”.

A “amostra” tem que ser representativa da “população”, para que os parâmetros estatísticos que se pretendem calcular tenham uma relação real com a referida “população”.

Assim, se no caso da sondagem referida na Introdução, a amostra incluíce cidadãos com menos de 18 anos, essa amostra não seria representativa da população, uma vez que em Portugal aqueles cidadãos não estão habilitados a votar.

A representatividade de uma amostra é determinada´pela sua dimensão e pelo método de amostragem (escolha dos elementos que irão constituir a amostra).

O cálculo da dimensão da amostra, não incluído no âmbito deste artigo, é normalmente realizado por métodos computacionais.

Variável Aleatória

Define-se “variável aleatória”, que em todos os tratados da especialidade se representa por “X”, como uma função (função é um “operador” matemático, normalmente representado por “f(x)”, que “transforma” um valor noutro, mediante uma expressão matemática – exemplos: “f(x)=x2”; “f(x)=cos x”) que associa a todos os acontecimentos pertencentes a uma amostra um único número real.

Consideremos como exemplo a extracção, de um saco, de 5 bolas com as mesmas dimensões, com as cores “azul”, “vermelho, “verde”, “amarelo” e “castanho”.

Os resultados possíveis são constituídos pelo conjunto A = { azul, vermelho, verde, amarelo, castanho}, mas o resultado de uma extração não segue nenhuma lei matemática, antes depende do acaso.

Assim, neste exemplo,o resultado obtido na extração é uma variável aleatória.

Frequência de um Acontecimento

Relativamente à frequência de um acontecimento, definem-se os seguintes conceitos:

a) “Frequência Absoluta” ( “fi” ) – é o número de vezes que o valor de determinado acontecimento (acontecimento “i”) é observado.

b) Frequência Absoluta Acumulada ( Fi )– é a soma das frequências absolutas de todos os acontecimento, e é calculada pela seguinte fórmula:

“Fi = f1+f2+…+fi+…+fn”, onde “n” representa o número total de acontecimentos.

c) Frequência Relativa ( fri ) – é o quociente entre a frequência absoluta do valor do acontecimento e o número total de acontecimentos e é calculada pela seguinte fórmula:

“fri = fi/n”, onde “n” representa o número total de acontecimentos.

d) Frequência Relativa Acumulada ( Fri )– é a soma das frequências relativas de todos os acontecimento, e é calculada pela seguinte fórmula:

“Fri = fr1+fr2+…+fri+…+frn”

Parâmetros Estatísticos

Desvio padrão

O desvio padrão – representado por “σ” (sigma) – permite calcular a maneira como variam os acontecimentos possíveis de uma variável aleatória “X” (o que se chama “dispersão estatística”), e é calculado pela seguinte fórmula:

“σ = √(E((X – E((X))2) = √(E(X2)-(E(X))2)”

onde “E(X)” é o “valor esperado, ou média, de “X”.

Variância

A variância de uma variável aleatória “X”, que se representa por “var(X)”, é também uma medida da sua dispersão estatística, indicando o seu afastamento em relação ao valor médio da amostra (a que se chama “média” ou “valor esperado”).

Sendo μ = E(X) a média da variável aleatória “X”, a variância é calculada pela fórmula:

“var(X) = E((X-μ)2)”

Outra fórmula que permite calcular a variância, é a seguinte:

“var(X) = E(X2) – (E(X))2”

Podemos assim concluir que “var(X) = σ2”.

Covariância

A covariância é um parâmetro estatístico utilizado para medir a interdependência entre duas variáveis aleatórias “X” e “Y”, isto é, a medida como as duas variáveis aleatórias variam conjuntamente; representa-se por “cov(X,Y)”.

A covariância entre duas variáveis aleatórias “X” e “Y”, com médias “E(X) = μx” e
“E(Y) = μy” é definida pela seguinte equação:

“cov(X,Y) = E((X – μx) x (Y – μy))”

Coeficiente de variação

O coeficiente de variação, que se representa por “cv”, é uma medida de dispersão que se utiliza para a comparação de variáveis aleatórias com distribuições diferentes, e que é calculado, para cada variável aleatória, de acordo com a seguinte fórmula:

“cv = σ / μ”

Média

A média é o valor onde mais se concentram os dados de uma distribuição estatística.

Normalmente são utilizadas as seguintes médias:

Média aritmética (“MA”)

A média aritmética de “n” números, cujos valores são “a1, a2, …, an” é calculada de acordo com a seguinte formula:

“MA = (a1+a2+…+an) / n”

Média geométrica (“MG”)

A média geométrica de “n” números, cujos valores são “a1, a2, … ,an”, é calculadapela raíz de índice “n” do produto desses “n” números, isto è:

“MG = (n√)(a1xa2x…xan)”

Média ponderada (“MP”)

A média ponderada de “n” valores, cada qual com a sua ponderação (ou peso), define-se como o quociente entre a “soma dos produtos desses valores, multiplicados pela respectiva ponderação” e a ” soma das ponderações”.

Consideremos 4 valores “a”, “b”, “c” e “d”, com as ponderações “u”, “v”, “w” e “z”, respectivamente. A média ponderada é claculada pela expressão:

“MP = (a* u + b*v + c*w + d*z) / (u + v + w + z)”

Moda

A moda é o acontecimento que se verifica mais vezes, isto é, que tem o maior número de observações, ou seja, o valor ou valores mais frequentes.

Intervalo de confiança

O intervalo de confiança, que se designa por “IC” é um conjunto que contém os valores ou acontecimentos com maior probabilidade de acontecerem.

O intervalo de confiança permite identificar a fiabilidade de uma estimativa.

Distribuições Estatísticas

As distribuições estatísticas são funções que definem linhas geométricas, contínuas ou não, que permitem determinar a probabilidade de ocorrer um determinado acontecimento.

  • As “Distribuições Estatísticas” utilizadas são as seguintes:
  • Distribuição uniforme
  • Distribuição de Poisson
  • Distribuição, normal ou gaussiana ou de Gauss
  • Distribuição binominal

Distribuição Uniforme

A distribuição uniforme é uma distribuição de probabilidades contínua, como representado na figura 2.

A probabilidade de um acontecimento estar num intervalo contido na amostra é proporcional ao tamanho do intervalo.

Distribuição de Poisson

Esta distribuição é uma distribuição não contínua (discreta) e permite calcular a probabilidade da ocorrência do número de acontecimentos em tempo ou região pré-determinados, sendo conhecida o valor médio dos acontecimentos, e considerando num período de tempo ou parte de um espaço, considerando que cada acontecimento é independente do anterior.

Esta distribuição é definida pela seguinte fórmula:

“P(X=k) = (e (expoente –μ) * μ (expoente k) / k!”

Distribuição de Gauss

A distribuição de Gauss, que se encontra representada na figura 4, é a que ocorre mais frequentemente

Um exemplo típico da distribuição é a forma como se distribuem as notas dos alunos de uma escola.

Esta distribuição é uma distribuição contínua que é definida pela seguinte equação:

“f(x) dx = (1 / (√(2*π) * σ)) * e (expoente (–(x-μ)2)/2*σ2)) dx”

Distribuição Binomial

Na distribuição binomial, que se representa na figura 5, as probabilidades dos acontecimentos correspondem aos termos de um polinómio.

Leave a Reply

Your email address will not be published. Required fields are marked *