sábado, 17 de mayo de 2014

TEMA 8. MEDIDAS DE TENDENCIA CENTRAL, POSICION Y DISPERSION.


En este tema, conoceremos los tres tipos de medidas estadísticas que se aplican especialmente a variables cuantitativas. Distinguiendo tres grandes tipos de medidas.
  • Medidas de posición. Calcula la magnitud, tamaño o posición de las observaciones de los datos una vez que están ordenados de menor a mayor.
  • Medidas de tendencia central. Dan una idea del comportamiento central mayoritario.
  • Medidas de dispersión: muestran información sobre la heterogeneidad de la muestra.

A continuación, procedemos a explicar en profundidad cada una de estas medidas, comenzando con las medidas de tendencia central.
  • Media aritmética: es la suma de todos los valores de la variable observada entre el total de observaciones. Cuando los datos están agrupados en el caso de que tengamos una tabla de frecuencia como ya se explicó en el tema anterior, existe una forma diferente de calcular la media tomando como referencia el valor de la marca de clase de cada intervalo sumada a su frecuencia absoluta dividido entre el número total de observaciones.
  • La mediana: se calcula después de haber ordenado los datos de menor  a mayor y su valor será el que deje a su izquierda un 50% de los datos menor y un 50% de los datos mayor suponiendo que la muestra sea impar. En caso de que esta sea par se realiza la media de los dos datos centrales.
  • Moda: es el dato que más veces se repite. En el caso de que los datos estén agrupados, la moda se corresponde con el intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.
Otro tipo de medidas importante tal y como hemos expuesto anteriormente son las medidas de posición.
  • Los percentiles: dividen la muestra ordenada en 100 partes.
  • Deciles: fracciona la muestra ordenada en 10 partes.
  • Cuartiles: fracciona la muestra ordenada en 4 partes.
Finalmente, encontramos las medidas de dispersión. En ella encontramos.
  • Rango o recorrido que es una diferencia entre el mayor y el menor valor de la muestra.
  • Desviación media: es la media aritmética de cada observación con respecto a la media de la muestra.
  • Desviación típica, cuantifica el error que cometemos si representamos una muestra únicamente por su media, la misma información que está pero en valores cuadráticos la expresa la varianza.
  • Coeficiente de variación. Es una medida de dispersión relativa que nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida.
Finalmente, este tema nos explica que una distribución normal o distribución de Gauss es aquella distribución de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.  Este tipo de distribuciones, en un histograma se refleja como una campana, por eso se conoce como campana de Gauss, y el punto  más alto de la misma coincidirá a su vez con la media y la mediana. Es una gráfica simétrica que deja a la mitad por un lado los valores menores a la media y por otro lado los valores mayores a la misma.

Por otro lado, podemos tener representaciones graficas que representen asimetrías de las variables, por lo tanto diferenciamos entre:
  • Asimetría hacia la izquierda, es aquella grafica en la que vemos el pico hacia la derecha. Presenta una asimetría negativa puesto que la mayor concentración de valores se presenta a la izquierda.
  • Asimetría hacia la derecha, el pico lo encontramos a la izquierda.  Presenta una distribución asimétrica positiva ya que existe mayor concentración de valores a la derecha de la media.
Cuanto más asimétrica sea una variable, valores más diferentes encontraremos.

Como punto final de este tema, pasamos a explicar la curtosis, la cual sirve para medir el grado de concentración de los valores que toma en torno a su media. Los datos se acumulan mucho, mientras más se acumulen, más apuntada esta la curva. Los resultados de curtosis pueden ser.
  • G2= 0 es un grado de concentración medio alrededor de los valores centrales de la variable.
  • G2>0 es un grado de concentración elevado alrededor de los valores centrales de la variable.
  • G2<0 es un grado de concentración mínimo alrededor de los valores centrales de la variable.

No hay comentarios:

Publicar un comentario