Qué es, Significado y Concepto

Definición de Medidas de dispersión

Artículo escrito por Cristian | Actualizado: octubre 30, 2018

Medidas de dispersión, parámetros estadísticos que miden cómo de diseminados se encuentran los datos de una distribución. Los más utilizados se refieren al grado de lejanía de los datos respecto a la media y son la desviación media, la varianza, la desviación típica y el coeficiente de variación.

La desviación media, D.m., es un promedio de los valores absolutos de las desviaciones, |xi – |, de cada elemento, xi, de la distribución respecto a su media, :

Por ejemplo, en la distribución 4, 6, 6, 7, 9, 11, 13, cuya media es 8, la desviación media es:

La varianza, V, es el promedio de los cuadrados de las desviaciones, (xi – )2, de cada elemento, xi, respecto a la media, :

La fórmula anterior es equivalente a esta otra:

que resulta más cómoda de aplicar, sobre todo cuando la media, , no es un número entero.

En la distribución 4, 6, 6, 7, 9, 11, 13, de media 8, la varianza es:

Aplicando la segunda fórmula se obtiene, obviamente, el mismo resultado:

La desviación típica o desviación estándar, σ, es la raíz cuadrada de la varianza:

La razón de ser de este parámetro es conseguir que la medida de dispersión se exprese en las mismas unidades que los datos a los que se refiere. Por ejemplo, en una distribución de estaturas en la que los datos están dados en centímetros (cm), la media viene dada en centímetros, pero la varianza en centímetros cuadrados (cm2). Para evitar este inconveniente se calcula su raíz cuadrada, obteniéndose así la desviación típica en centímetros.

El par de parámetros formado por la media y la desviación típica (, σ) aporta una información suficientemente buena sobre la forma de la distribución.

El coeficiente de variación, C.V., es el cociente entre la desviación típica y la media de la distribución:

Este parámetro sirve para relativizar el valor de la desviación típica y así poder comparar la dispersión de dos poblaciones estadísticas con gamas de valores muy discretas. Por ejemplo, si en una compañía mexicana los salarios de los empleados tienen una media 1 = 7.000 pesos y una desviación típica σ1 = 500 pesos y en otra empresa española la media de los salarios es 2 = 200.000 pesetas y la desviación típica σ2 = 40.000 pesetas, para comparar la dispersión de salarios se recurre al coeficiente de variación:

C.V.1 = 500/7.000 = 0,07

C.V.2 = 40.000/200.000 = 0,2

Se aprecia así que en la primera compañía los salarios tienen menor dispersión que en la segunda.

Otras medidas de dispersión son el recorrido y el recorrido intercuartílico.

El recorrido es la diferencia entre los valores mayor y menor de la distribución. Indica, pues, la longitud del tramo en el que se hallan los datos. También se llama rango.

El recorrido intercuartílico es la diferencia, Q3 – Q1 , entre el cuartil superior, Q3, y el cuartil inferior, Q1. El par de parámetros formado por la mediana, Me, y el recorrido intercuartílico, Q3 – Q1, proporciona una buena información sobre la forma de la distribución.

CÁLCULO DE Σ A PARTIR DE UNA TABLA DE FRECUENCIAS

Cuando la distribución estadística viene dada por una tabla de frecuencias en la que la variable toma n valores, x1, x2,…, xn, cada uno de ellos con su correspondiente frecuencia, f1, f2,…, fn, la obtención de la desviación típica se realiza cómodamente procediendo como se explica a continuación.

A la tabla de frecuencias con las columnas xi de los datos y fi de las frecuencias, se añaden dos nuevas columnas:

La tercera columna, fixi, se obtiene multiplicando término a término los elementos de las dos primeras columnas; la cuarta columna, fixi2, se obtiene multiplicando los términos de la primera por los de la tercera.

La suma de la columna segunda proporciona el número de elementos de la distribución, N:

N = Σfi

La suma de la columna tercera permite calcular la media, :

Conocida la media, la varianza se obtiene utilizando la suma de la columna cuarta:

La desviación típica es la raíz cuadrada de la varianza:

Por ejemplo, en la distribución

el número de elementos es N = 85 y la media

 = 456/85 = 5,36

Y la varianza y la desviación típica son:

V = 2636/85 – 5,362 = 2,28