domingo, 25 de octubre de 2009

Medidas de Tendencia Central

Son los valores numéricos que indican el "centro" de un conjunto de datos, describen a todo el conjunto señalando una característica que destaca. Los estadígrafos de tendencia central más importantes son:

A. MEDIA ARITMETICA O PROMEDIO ARITMÉTICO: Es el punto de equilibrio de una serie de datos, el valor que tendrían todos los datos de no existir diferencias entre ellos.

a) Para datos no agrupados: Se obtiene sumando los valores de todos los datos y dividiendo esta suma entre el número total de datos. La fórmula es:







b) Para datos agrupados: La media se obtiene sumando el producto que se obtiene del valor medio del intervalo de clase por la frecuencia de esa clase y dividiendo esta suma entre el número total de datos. El valor medio del intervalo de clase se obtiene sumando el límite inferior más el límite superior de la clase y dividiendo esta suma entre dos. La fórmula es:







EJEMPLOS

La media tiene como ventajas cuando los datos están distribuidos normal o simétricamente, es de gran estabilidad porque toma en cuenta todos los datos y nos permite estimar y probar parámetros en inferencias.

Sin embargo, también tiene algunas desventajas como que al incluir todos los datos, puede ser afectado por valores extremos, por ello no es recomendable calcular la media en datos agrupados que tienen clases abiertas en los extremos.



B. MEDIANA: Es un valor numérico de posición central, que nos determina que el 50 % de las observaciones sea menor o igual que él y el otro 50 % sea mayor o igual. Para obtenerlo se deben seguir los siguientes pasos:

a) Para datos no agrupados:

A. Ordenar los datos de menor a mayor.

B. Determinar la posición con:

pMd = n+1 = E + f (Entero + fracción)
2

C. Calcular el valor de la mediana con:

v
Md = xE + fD donde D = (xE+1 - xE)


b) Para datos agrupados:

A. Obtener Nh (número de datos acumulado)

B. Determinar la posición de la mediana (y marcar la clase que la contiene), con:






C. Calcular el valor de la mediana con:



EJEMPLOS

Donde:


L
Mdi = Límite real inferior (por redondeo) de la clase que contiene la mediana

IMd = Tamaño del intervalo de la clase Mediana.
N
(Md-1) = Número de datos acumulado hasta la clase anterior a la clase mediana
n
Md = Número de datos de la clase mediana.

La mediana no está afectada por valores extremos, es útil cuando los datos agrupados tienen clases abiertas en los extremos. Se aplica también a variables de la escala ordinal.



C. MODA: Es el valor que más se repite, ó, en una distribución de frecuencias, es el valor de más alta frecuencia. Si hay dos o más valores con esta característica, se dice entonces que el conjunto de datos es bi o multimodal. Si la cantidad de elementos que se repiten es mayor que n/2, entonces se afirma que no hay moda.


a) Para datos no agrupados: La moda es el valor más frecuente o el que más se repite.


b) Para datos agrupados:


A. La posición de la moda está en la clase de frecuencia máxima, a ella se le denomina clase moda.

pMo = nmáx


B. El valor de la moda se calcula con:

vMo = LMoi + IMo D1

D1 + D2


EJEMPLOS

Donde:

LMoi = Límite real inferior (por redondeo) de la clase moda

IMo = Tamaño del intervalo de la clase moda
D1 = nMo - n(Mo-1)
D2 = nMo - n(Mo+1)

nMo = Valor de la clase moda

n(Mo-1) = Valor de la clase anterior a la clase moda

n(Mo+1) = Valor de la clase posterior a la clase moda.

1 comentario: