» Tecnologia » Software » Como calcular variância

Como calcular variância

Galeria
Como calcular variância

Na probabilidade e na estatística, a atribuição dada a uma medida da sua dispersão estatística para uma variável qualquer é designada por variância, isto é, é uma medida que indica quanto o valor dessa variável se irá desviar num reduzido espaço de tempo dos valores esperados para um longo prazo. Matematicamente falando, quando temos uma variável aleatória real, a sua variância é o seu segundo momento central e o seu segundo cumulante, valores que apenas variam do momento central quando estamos com grau igual ou superior a quatro.

Dificuldade
Fácil
Instruções
  1. 1

    Após a definição do que é a variância, podemos então designá-la matematicamente. Define-se a variância como sendo a medida que obtemos quando se somam os quadrados dos desvios dos valores que temos nos conjuntos a analisar, quando estes são comparados com a sua média e dividindo pelo número de observações menos um, isto é:
    ∑ (xi – Média)^2 / (n – 1)
    A utilização do denominador “n – 1” da variância determina os graus de liberdade, conceito usualmente utilizado em estatística, que tem como base conjunto de “n” valores e que utilizando uma média para esse grupo, então existe a liberdade de escolher os valores numéricos de n-1 observações, fixando o valor da última observação para atender ao requisito de ser a soma dos desvios da média igual a zero.
    Isto tudo pode ser mais facilmente explicado, pois a variância é a medida que faz uma avaliação do espaçamento dos dados face à média aritmética. Se tivéssemos dois conjuntos de dados como os seguintes:
    Conjunto 1 -> 1, 3, 5, 7, 9
    Conjunto 2 -> 3, 4, 5, 6, 7
    Para estes dois conjuntos em causa a sua média é de 5. Teremos de determinar o desvio, que significa o quanto cada um dos valores do conjunto se encontram afastados da média, e calcula-se de forma simples. Como exemplo, para o conjunto 1 temos:
    DC1_1 = C1_1 - média = 1 - 5 = -4
    DC1-2 = C1_2 - média = 3 - 5 = -2
    Os desvios são respectivamente:
    DC1 = -4, -2, 0, 2, 4
    DC2 = -2, -1, 0, 1, 2

    Pode-se confirmar que o conjunto 2 tem desvios menores, logo tem dados mais próximos da média. A variância pretende expressar isso, já que o seu valor é atribuído pela média dos quadrados dos desvios. Por isso, é de fácil entendimento de que quanto maior a dispersão dos dados, por consequente, maior será a sua dispersão.
    Para os desvios determinados, iremos agora calcular o quadrados dos mesmos, obtendo:
    D^2C1 = 16, 4, 0, 4, 16
    D^2C2 = 4, 1, 0, 1, 4
    A média destes desvios quadrados é respectivamente 8 e 2.
    Com isto, obtém-se que a variância do conjunto 1 é 8 e a do conjunto 2 é 2, concluindo que a variância do conjunto 1 é maior devido ao maior afastamento da média.

Comentários
blog comments powered by Disqus