MANEJO DE DATOS
Propiedades de los datos cuantitativos
Ya vimos que el material con que cuenta el estadístico es un conjunto de datos. Pero,
la recolección de datos es sólo uno de los aspectos de la estadística descriptiva ¿cómo se
pueden utilizar esos datos?
A veces los datos estadísticos obtenidos de muestras, experimentos o cualquier colección de mediciones, son tan numerosos que carecen de utilidad a menos que sean condensados.
Veremos tres propiedades de los datos cuantitativos que permiten una mejor comprensión de la información por ellos aportada.
Estas propiedades pueden ser expresadas por diversas medidas, que agrupamos de la
siguiente manera:
1. de tendencia central
2. de dispersión
3. de forma
Cuando se calculan a partir de los datos muestrales, reciben el nombre de estadísticos,
y si se los calcula a partir de la población, se denominan parámetros.
Medidas de tendencia central
Con este nombre nos referimos a valores promedios que describen todo un conjunto de
datos. Se utilizan cuatro promedios, frecuentemente, como medidas de tendencia central o
de posición: la media aritmética, la mediana, la moda y el rango medio.
Media aritmética: es la medida de posición utilizada con más frecuencia. Si
X1, 2 n X .... X constituyen una muestra de n observaciones, la media aritmética se define
de la siguiente manera:
Es una de las medidas más utilizadas posee la desventaja de ser muy afectada
por los valores extremos, pues en su cálculo se utilizan todas las observaciones. Puede
entonces dar una imagen distorsionada de la información contenida en los datos, por lo
que no siempre es la mejor medida de posición.
Mediana: Es el valor que ocupa la posición central en un conjunto de datos,
ordenados en forma creciente o decreciente. Así definida, la mitad de las observaciones es
menor que la mediana, mientras que la otra mitad es mayor que la mediana. Resulta
apropiada cuando el conjunto de datos posee observaciones extremas.
Para calcular la mediana, primero se deben ordenar los datos. Luego se debe
determinar el dato que ocupa la posición (n+1)/2 (cuando n es impar) o la semisuma de los
valores numéricos correspondientes a las dos observaciones centrales (cuando n es par).
Por ejemplo, si los datos son: 25 12 23 28 17 15, se obtiene el arreglo ordenado 12 15 17 23 25 28, y la mediana se obtiene promediando los valores 17 y 23, resultando igual a 20.
El cálculo de la mediana se ve afectado por el número de observaciones, y no por la
magnitud de los valores extremos.
Moda: es el valor de un conjunto de datos que aparece con mayor frecuencia.
Tampoco depende de los valores extremos, pero es más variable que las otras medidas de
posición para las distintas muestras.
Cuando no hay ningún valor con frecuencia mayor, la distribución carece de moda.
También se puede dar el caso de una distribución con más de una moda.
Rango medio: Es la media de las observaciones mayor y menor. Como
intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como
medida de posición, pero frecuentemente ofrece una valor adecuado rápido y sencillo para
resumir un conjunto de datos (cuando puede suponerse que no existen valores extremos).
JUEVES, 7 DE NOVIEMBRE DE 2013
Medidas de tendencia central
Medidas de de tendencia central
La medidas de centralización nos indican en torno a qué valor
(centro) se distribuyen los datos.
(centro) se distribuyen los datos.
La medidas de centralización son:
MODA
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la
misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir, tienevarias modas.
misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir, tienevarias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo
tienen la misma frecuencia, no haymoda.
tienen la misma frecuencia, no haymoda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima,
la moda es el promedio de las dos puntuaciones adyacentes.
la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor
aproximado de ésta:
aproximado de ésta:
Ejemplo
Calcular la moda de una distribución estadística que viene
dada por la siguiente tabla:
dada por la siguiente tabla:
| fi | |
|---|---|
| [60, 63) | 5 |
| [63, 66) | 18 |
| [66, 69) | 42 |
| [69, 72) | 27 |
| [72, 75) | 8 |
| 100 |
2º Los intervalos tienen amplitudes distintas.
En primer lugar tenemos que hallar las alturas.
La clase modal es la que tiene mayor altura.
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
Ejemplo
En la siguiente tabla se muestra las calificaciones
(suspenso, aprobado, notable y sobresaliente) obtenidas
por un grupo de 50 alumnos. Calcular la moda.
(suspenso, aprobado, notable y sobresaliente) obtenidas
por un grupo de 50 alumnos. Calcular la moda.
| fi | hi | |
|---|---|---|
| [0, 5) | 15 | 3 |
| [5, 7) | 20 | 10 |
| [7, 9) | 12 | 6 |
| [9, 10) | 3 | 3 |
| 50 |
MEDIANA
Es el valor que ocupa el lugar central de
todos los datos cuando éstos están ordenados de menor a mayor.
todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana
es la puntuación central de la misma.
es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana
es la media entre las dos puntuaciones centrales.
es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre
.
Li es el límite inferior de la clase donde se encuentra la mediana.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Ejemplo
Calcular la mediana de una distribución estadística que
viene dada por la siguiente tabla:
viene dada por la siguiente tabla:
| fi | Fi | |
|---|---|---|
| [60, 63) | 5 | 5 |
| [63, 66) | 18 | 23 |
| [66, 69) | 42 | 65 |
| [69, 72) | 27 | 92 |
| [72, 75) | 8 | 100 |
| 100 |
100 / 2 = 50
Clase modal: [66, 69)
MEDIA ARITMÉTICA
La media aritmética es el valor obtenido al sumar
todos los datos y dividir el resultado entre el número total de datos.
todos los datos y dividir el resultado entre el número total de datos.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias,
la expresión de la mediaes:
la expresión de la mediaes:
Ejercicio de media aritmética
En un test realizado a un grupo de 42 personas se han
obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
| xi | fi | xi · fi | |
|---|---|---|---|
| [10, 20) | 15 | 1 | 15 |
| [20, 30) | 25 | 8 | 200 |
| [30,40) | 35 | 10 | 350 |
| [40, 50) | 45 | 9 | 405 |
| [50, 60 | 55 | 8 | 440 |
| [60,70) | 65 | 4 | 260 |
| [70, 80) | 75 | 2 | 150 |
| 42 | 1 820 |
Propiedades de la media aritmética
1 La suma de las desviaciones de todas las
puntuaciones de una distribución respecto a la media de la misma igual a cero.
puntuaciones de una distribución respecto a la media de la misma igual a cero.
Las suma de las desviaciones de los números 8, 3, 5, 12, 10
de su media aritmética 7.6 es igual a 0:
de su media aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2 La media aritmética de los cuadrados de las desviaciones
de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho númerocoincide con la media aritmética.
de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho númerocoincide con la media aritmética.
3 Si a todos los valores de la variable se les suma un mismo número,
la media aritmética queda aumentada en dicho número.
la media aritmética queda aumentada en dicho número.
4 Si todos los valores de la variable se multiplican por un mismo
número lamedia aritmética queda multiplicada por dicho número.
número lamedia aritmética queda multiplicada por dicho número.
Observaciones sobre la media aritmética
1 La media se puede hallar sólo para variables cuantitativas.
2 La media es independiente de las amplitudes de los intervalos.
3 La media es muy sensible a las puntuaciones extremas.
Si tenemos una distribución con los siguientes pesos:
Si tenemos una distribución con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de
centralización poco representativa de la distribución.
centralización poco representativa de la distribución.
4 La media no se puede calcular si hay un intervalo
con una amplitud indeterminada.
con una amplitud indeterminada.
| xi | fi | |
|---|---|---|
| [60, 63) | 61.5 | 5 |
| [63, 66) | 64.5 | 18 |
| [66, 69) | 67.5 | 42 |
| [69, 72) | 70.5 | 27 |
| [72, ∞ ) | 8 | |
| 100 |
En este caso no es posible hallar la media porque no
podemos calcular la marca de clase de último intervalo.
podemos calcular la marca de clase de último intervalo.

No hay comentarios:
Publicar un comentario