Como calcular variância
Por GLG Contributor , December 21, 2011
Na probabilidade e na estatística, a atribuição dada a uma medida da sua dispersão estatística para uma variável qualquer é designada por variância, isto é, é uma medida que indica quanto o valor dessa variável se irá desviar num reduzido espaço de tempo dos valores esperados para um longo prazo. Matematicamente falando, quando temos uma variável aleatória real, a sua variância é o seu segundo momento central e o seu segundo cumulante, valores que apenas variam do momento central quando estamos com grau igual ou superior a quatro.
- Dificuldade
- Fácil
Instruções
-
1
Após a definição do que é a variância, podemos então designá-la matematicamente. Define-se a variância como sendo a medida que obtemos quando se somam os quadrados dos desvios dos valores que temos nos conjuntos a analisar, quando estes são comparados com a sua média e dividindo pelo número de observações menos um, isto é:
∑ (xi – Média)^2 / (n – 1)
A utilização do denominador “n – 1” da variância determina os graus de liberdade, conceito usualmente utilizado em estatística, que tem como base conjunto de “n” valores e que utilizando uma média para esse grupo, então existe a liberdade de escolher os valores numéricos de n-1 observações, fixando o valor da última observação para atender ao requisito de ser a soma dos desvios da média igual a zero.
Isto tudo pode ser mais facilmente explicado, pois a variância é a medida que faz uma avaliação do espaçamento dos dados face à média aritmética. Se tivéssemos dois conjuntos de dados como os seguintes:
Conjunto 1 -> 1, 3, 5, 7, 9
Conjunto 2 -> 3, 4, 5, 6, 7
Para estes dois conjuntos em causa a sua média é de 5. Teremos de determinar o desvio, que significa o quanto cada um dos valores do conjunto se encontram afastados da média, e calcula-se de forma simples. Como exemplo, para o conjunto 1 temos:
DC1_1 = C1_1 - média = 1 - 5 = -4
DC1-2 = C1_2 - média = 3 - 5 = -2
Os desvios são respectivamente:
DC1 = -4, -2, 0, 2, 4
DC2 = -2, -1, 0, 1, 2
Pode-se confirmar que o conjunto 2 tem desvios menores, logo tem dados mais próximos da média. A variância pretende expressar isso, já que o seu valor é atribuído pela média dos quadrados dos desvios. Por isso, é de fácil entendimento de que quanto maior a dispersão dos dados, por consequente, maior será a sua dispersão.
Para os desvios determinados, iremos agora calcular o quadrados dos mesmos, obtendo:
D^2C1 = 16, 4, 0, 4, 16
D^2C2 = 4, 1, 0, 1, 4
A média destes desvios quadrados é respectivamente 8 e 2.
Com isto, obtém-se que a variância do conjunto 1 é 8 e a do conjunto 2 é 2, concluindo que a variância do conjunto 1 é maior devido ao maior afastamento da média.