Contenido Primer Parcial Estadistica I 1501

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 33

Tablas de frecuencias con datos agrupados

Usamos las tablas de frecuencias con datos agrupados cuando la variable toma
un gran número de valores o es una variable continua. Para ello, se agrupan los
diferentes valores en intervalos de igual amplitud, a los cuáles llamamos clases.

Aparecen además algunos parámetros importantes:

 Límites de clase: cada clase es un intervalo que va desde el límite


inferior, hasta el límite superior.
 Marca de clase: es el punto medio de cada intervalo, y representa a la
clase para el cálculo de algunos parámetros.
 Amplitud de clase: es la diferencia entre el límite superior y el límite
inferior.

Recuerda que los intervalos no deben superponerse, es decir, deben ser


mutuamente excluyentes.

Los DATOS son el conjunto de observaciones de una o más características


obtenidas de una población o de una muestra.

La observación de la característica de interés en la muestra proporciona los


DATOS.

Los datos pueden consistir en un conjunto de valores numéricos o modalidades.

Por ejemplo:

 Si se sondea a la población de electores de Danlí sobre su intención de votar a


determinado candidato los datos presentan dos modalidades: SI/NO.

 En el caso de que se analicen los resultados académicos de los estudiantes


del Campus, los datos serán valores numéricos, de 0 a 100.

 En el caso de que se analice el importe del alquiler de las viviendas de una


localidad, los datos son valores numéricos en lempiras.

Las VARIABLES son las características de los individuos que se quieren estudiar
y pueden tomar distintas modalidades o valores.

Es importante distinguir entre los distintos tipos de datos con los que podemos
tratar. Sus diferencias determinan la selección y aplicación de las técnicas
estadísticas

Estadística I. 1501 WISA 2020 Pá gina 1


TABLA DE FRECUENCIAS

Recoge de forma resumida el conjunto de datos resultantes de la observación de


una variable en un colectivo o muestra de n individuos.

Tipos de tabla de frecuencias:

1. Tabla de frecuencias con los valores de la variable sin agrupar.

Frec.
Frecuenci Frec. Frecuenci
Autos Frecuenci porcentua
a Frecuenci relativa a
vendido a l
acumulad a relativa acumulad porcentua
s absoluta acumulad
a a l
a

Total

Estadística I. 1501 WISA 2020 Pá gina 2


2. Tabla de frecuencias con los valores de la variable agrupados en intervalos.

Marca de Frecuencia Frecuencia Frecuencia Frec. relativa


Intervalo
clase absoluta acumulada relativa acumulada

Total

Ejercicio:

A continuación se presenta el retraso en minutos de 81 vuelos entre San Pedro


Sula-Tegucigalpa de la compañía AB:

0.43 1.50 2,05 2,58 2,86 2,93 3,90 4,38 4,46 5,11 5,23
5,36 5,44 5,54 6,08 6,12 6,36 6,39 6,48 6,51 6,88 7,31
7,34 8,06 8,10 8,20 8,21 8,23 8,34 8,56 8,64 8,73 8,73
8,73 8,73 8,74 8,88 8,90 8,93 9,14 9,25 9,56 9,68 9,85
9,87 9,94 9,99 10,06 10,11 10,24 10,26 10,51 11,23 11,60 11,63
11,64 11,85 11,92 12,34 12,78 12,94 13,05 13,18 13,31 13,48 13,88
14,05 14,15 14,23 14,24 14,30 14,55 14,59 15,42 15,45 15,71 16,07
16,54 16,84 17,04 19.39

Agrupe los datos en una distribución de frecuencias y realice su representación


gráfica.

Pasos a desarrollar:

1. Ordenar los datos ( De menor a mayor) ósea en "orden ascendente "

2. Calcular el tamaño y número de clases.

 Determinación del número de intervalos o clases.

Cuando el tamaño muestra es moderado se fija provisionalmente un numero de


intervalos aproximadamente igual √n. (Raíz cuadrada de n)

En este caso:

Estadística I. 1501 WISA 2020 Pá gina 3


n= Numero de observaciones o datos
 n= 81 vuelos

 √ 81 = 9, de forma que, en principio, los valores de la variable se


agruparan en 9 intervalos.

Número de clases= 9

Nota: También para encontrar el número de intervalos Si el problema no indica


cuántos intervalos usar, se recomienda usar la regla de Sturgues:
K = 1 + 3.322.log(n); siendo n el número de datos

K = número de intervalos o clases

Amplitud del intervalo o tamaño de la clase:

La amplitud del intervalo, a, se fija aproximadamente como

a = Recorrido/ no de clases

El recorrido de esta variable, R, es:( También llamado Rango)

Recorrido o Rango= Valor máximo – Valor mínimo

R = Valor máximo – Valor mínimo = 19.39 – 0.43 = 18.96 (RANGO)

a = 18.96/9 clases = 2.10 » 2 (La amplitud del intervalo)

3. Construir la clase:

Limites superior e inferior de los intervalos

 El valor menor de la variable es 0.43, por lo que el límite inferior del primer
intervalo puede fijarse en 0.

 Para determinar el límite superior del primer intervalo al límite inferior se le


suma la amplitud a = 2; por tanto, dicho límite será 0 + 2(amplitud) = 2.
(límite superior de clase)

Estadística I. 1501 WISA 2020 Pá gina 4


El límite inferior del segundo intervalo coincide con el límite superior del
primero, es decir, 2 y su límite superior se obtiene sumándole la amplitud del
intervalo a = 2, y será 4.
De esta forma resultan los 9 intervalos siguientes:

0 – 2; 2 – 4, 4 – 6; 6 – 8; 8 – 10; 10 – 12; 12 – 14; 14- 16; 16 – 18

Como la variable toma valores mayores que 18 es necesario definir un


intervalo adicional de limites 18 y 20; luego se agruparan los valores de la
variable en 10 intervalos.

Por último, se tiene que indicar si los intervalos son abiertos o cerrados.
Por omisión, se interpreta que los intervalos son (Li-1, Li] cerrados por la derecha:

4. Elaborar la Distribución de frecuencias.

Retraso Frecuencia Marca Frecuencia Frecuencia Frecuencia Frecuencia Limites


(Clases) absoluta de absoluta relativa Relativa porcentual reales
Clase acumulada acumulada
0-2 2 1 2 0.025 0.025 2.5% 0 – 2.5
2-4 5 3 7 0.062 0.087 6.2% 2.5 – 4.5
4-6 7 5 14 0.086 0.173 8.6% 4.5 – 6.5
6-8 9 7 23 0.111 0.284 11.1% 6.5 – 8.5
8 - 10 24 9 47 0.296 0.580 29.6% 8.5 – 10.5
10 - 12 11 11 58 0.136 0.716 13.6% 10.5 – 12.5
12 - 14 8 13 66 0.099 0.815 9.9% 12.5 – 14.5
14 - 16 10 15 76 0.123 0.938 12.3% 14.5 – 16.5
16 - 18 4 17 80 0.049 0.987 4.9% 16.5 – 18.5
18 - 20 1 19 81 0.013 1 1.3% 18.5 – 20.5
Total 81 1 100%

Preguntas de análisis:

1. Determine el porcentaje de vuelos que experimentaron entre 5 y 16 minutos


de retraso?
 El porcentaje de vuelos que experimento un retaso entre 5 y 16
minutos es de 85.1%

2. Determine el porcentaje de vuelos que experimentaron más de 17


minutos de retraso?

 El porcentaje de vuelos que experimento un retaso de más de


17 minutos es de 6.2%

Estadística I. 1501 WISA 2020 Pá gina 5


3. Estime el número de vuelos que sufrieron al menos un retraso de 10
minutos?

Formas de presentación de una distribución de frecuencias


A. Forma continua: Evalúan variables continuas

Variables continúa: Minutos de retraso

Ejemplo de las clases:

0-2
2-4
4-6
6–8

B. Forma discreta: Evalúan variables discretas

Ejemplo de las clases:

0-2
3-5
6-8
9 – 10

 La marca de clase, también conocida como punto medio, es el valor que se


encuentra en el centro de una clase, el cual representa a todos los valores que
están en dicha categoría. Fundamentalmente, la marca de clase es usada para
el cálculo de ciertos parámetros, como la media aritmética o la desviación
estándar.

 Entonces, la marca de clase es el punto medio de cualquier intervalo.

La marca de clase es el valor central que representa una clase. Se obtiene


al sumar los límites del intervalo y dividir este valor entre dos.

Estadística I. 1501 WISA 2020 Pá gina 6


Esto podríamos expresarlo matemáticamente como sigue:

Marca de clase = (Límite inferior + Límite superior)/2.

Limites reales

 Los límites reales de clase se obtienen sumando al límite superior de un


intervalo de clase, el límite inferior del intervalo de clase contiguo superior y
dividiendo por 2.
 Se conocen como límites reales de clase o límites verdaderos de clase
 En los límites reales los valores son continuos

Estos límites se pueden calcular de dos formas:


Forma N.1

Limites reales = (Límite Superior de clase+ Límite inferior de clase)/2.

Forma N.2:

Los límites reales: son valores que unen a las clases y se forman únicamente de
números enteros, estos se obtienen al restar 0.5 a los límites de la izquierda y
sumar 0.5 a los límites de la derecha; cuando las clases tengan un decimal,
habrá que restar 0.05 a los límites de la izquierda y sumar 0.05 límites de la
derecha y así sucesivamente.

Representación grafica
Gráficas
Cuando se desea dar a conocer la forma en la que se distribuyen los datos, éstos
se presentan en una o varias gráficas. Las más importantes son 3 que son:

 Histograma
 Polígono Frecuencias

Estadística I. 1501 WISA 2020 Pá gina 7


 Ojivas

Histograma
Es una gráfica de barras rectangulares cuyas bases están centradas en la marca
de clase del intervalo, y sus áreas son proporcionales a la frecuencia del intervalo.
Es importante señalar que las distancias entre marcas de clase son siempre las
mismas, por lo que la condición de que las áreas de los rectángulos sean
proporcionales a las frecuencias, se convierte en la altura proporcional a la
frecuencia.

Histograma y Poligono de frecuencias


30

25

20
Histograma de Frecuencias
Poligono de Frecuencias
15

10

0
1 3 5 7 9 11 13 15 17 19

Polígono de Frecuencias

El polígono de frecuencias es una gráfica poligonal o de líneas rectas que indica


para cada marca de clase la frecuencia. Se obtiene uniendo los puntos medios de
las partes superiores de las barras del histograma. Para que la línea no se dibujó
"flotando", se puede dibujar una marca de clase antes de la primera y una marca
de clase posterior a la última, cada una con frecuencia cero, de esta forma la
gráfica poligonal parte del eje de las abscisas y termina en él.

Tanto el histograma como la ojiva, se dibujan generalmente con las frecuencias


absolutas, pero también pueden dibujarse con las frecuencias relativas, con las
acumuladas o con las acumuladas relativas.

Ojiva
La ojiva es también una gráfica poligonal, pero se dibuja utilizando las fronteras
contra las frecuencias acumuladas(o acumuladas relativas).La ojiva indica, para
cada frontera, los elementos(o proporción de elementos), que son menores o

Estadística I. 1501 WISA 2020 Pá gina 8


iguales que dicha frontera. Si se utiliza la frecuencia acumulada relativa se llama
ojiva porcentual. A la ojiva también se le llama en ocasiones polígono de
frecuencias acumuladas.

Ojivas Menor que y Mayor Que


90
80 81 80 80 81
76 76
70
66 66
60 58 58 Menor Que
50 47 Mayor Que
40
30
20 23 23
14 14
10 7 7
0 0 2 2 0
2.5 4.5 6.5 8.5 10.5 12.5 14.5 16.5 18.5 20.5

Medidas de tendencia central


Al describir grupos de diferentes observaciones, con frecuencia es conveniente
resumir la información con un solo número. Este número que, para tal fin, suele
situarse hacia el centro de la distribución de datos se denomina medida o
parámetro de tendencia central o de centralización.

Entre las medidas de tendencia central tenemos:

 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana
 Moda

Se debe tener en cuenta que existen variables cualitativas y variables


cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan
de acuerdo al tipo de variable que se está observando, en este caso se observan
variables cuantitativas.

La media aritmética

Estadística I. 1501 WISA 2020 Pá gina 9


La media aritmética es el valor obtenido por la suma de todos sus valores dividida
entre el número de sumadores.

Por ejemplo, las notas de 5 alumnos en una prueba:

Niño Nota

1 6.0

2 5.4

3 3.1

4 7.0

5 6.1

 Primero, se suman las notas:

6.0+5.4+3.1+7.0+6.1 = 27.6

 Luego el total se divide entre la cantidad de alumnos:

27.6/ 5 alumnos =5.52 nota promedio


=ΣX
n
Dónde:
: Media aritmética
X: Variable
n: Datos

La media aritmética en este ejemplo es 5.52

La media aritmética es, probablemente, uno de los parámetros estadísticos más


extendidos.

Se le llama también promedio o, simplemente, media.

Definición:

Dado un conjunto numérico de datos, x1, x2,..., xn, se define su media aritmética


como

Estadística I. 1501 WISA 2020 Pá gina 10


Esta definición varía, aunque no sustancialmente, cuando se trata de variables
continuas, esto es, también puede calcularse para variables agrupadas
en intervalos.

Propiedades:

Las principales propiedades de la media aritmética son:

 Su cálculo es muy sencillo y en él intervienen todos los datos.


 Su valor es único para una serie de datos dada.
 Se usa con frecuencia para comparar poblaciones, aunque es más
apropiado acompañarla de una medida de dispersión.
 Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto
de datos, ya que tiene la propiedad de equilibrar las desviaciones de los
datos respecto de su propio valor

Inconvenientes de su uso

Este parámetro, aun teniendo múltiples propiedades que aconsejan su uso en


situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en


función de la cantidad y amplitud de los intervalos que se consideren.

 Es una medida a cuyo significado afecta sobremanera la dispersión, de modo


que cuanto menos homogéneos sean los datos, menos información
proporciona. Dicho de otro modo, poblaciones muy distintas en su composición
pueden tener la misma media.

 En el cálculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen más peso que los valores cercanos a cero.

Estadística I. 1501 WISA 2020 Pá gina 11


 No se puede determinar si en una distribución de frecuencias hay intervalos de
clase abiertos.

Media aritmética ponderada

A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.
Si   son nuestros datos y   son sus "pesos"
respectivos, la media ponderada se define de la siguiente forma:

Media muestral

Esencialmente, la media muestral es el mismo parámetro que el anterior,


aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la
media aritmética se calcula para un subconjunto de la población objeto de
estudio.

La media muestral es un parámetro de extrema importancia en la inferencia


estadística, siendo de gran utilidad para la estimación de la media poblacional,
entre otros usos.

Moda

La moda es el dato más repetido de la encuesta, el valor de la variable con


mayor frecuencia absoluta. En cierto sentido la definición matemática
corresponde con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En


variables continuas, expresadas en intervalos, existe el denominado intervalo

Estadística I. 1501 WISA 2020 Pá gina 12


modal o, en su defecto, si es necesario obtener un valor concreto de la
variable, se recurre a la interpolación.

Por ejemplo, el número de personas en distintos vehículos en una carretera:


5-7-4-6-9-5-6-1-5-3-7.
El número que más se repite es 5, entonces la moda es 5.
 Existe una distribución bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.

 Cuando en una distribución de datos se encuentran tres o más modas,


entonces es multimodal.

 Por último, si todas las variables tienen la misma frecuencia diremos que no
hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la


moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor
frecuencia absoluta.

La moda, cuando los datos están agrupados, es un punto que divide el


intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del
intervalo, que verifiquen que:

Siendo   la frecuencia absoluta del intervalo modal y   y   las


frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al
intervalo modal.

Propiedades

 Cálculo sencillo.

 Interpretación muy clara.

Estadística I. 1501 WISA 2020 Pá gina 13


 Al depender solo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir una
población no es posible realizar otros cálculos.

Inconvenientes
 Su valor es independiente de la mayor parte de los datos, lo que la hace
muy sensible a variaciones muestrales. Por otra parte, en variables
agrupadas en intervalos, su valor depende excesivamente del número de
intervalos y de su amplitud.

 Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.

 No siempre se sitúa hacia el centro de la distribución.

 Puede haber más de una moda en el caso en que dos o más valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los


datos, una vez que éstos están ordenados de menor a mayor.

Por ejemplo, la mediana del número de hijos de un conjunto de trece familias,


cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que,
una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posición central es 2.

En caso de un número par de datos, la mediana no correspondería a ningún valor


de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales.

Por ejemplo, en el caso de doce datos como los siguientes:

Estadística I. 1501 WISA 2020 Pá gina 14


Se toma como mediana:

 Primero hallamos las frecuencias absolutas acumuladas Fi

Así, aplicando la fórmula asociada a la mediana para n impar, obtenemos X


(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias
absolutas:

Ni-1< n/2 < i = N19 < 19.5 < N20

Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En
nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo
que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos)

La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.

Ejemplo (n par)

Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase


vienen dadas por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9
Calificaciones Frecuencia absoluta Frecuencia acumulada
variable xi Número de falumnos
i 2 2 4 5 6 9 4 4 Fi
2
1 2 2
2 2 4
3 4 8
4 5 13
5 6 19 = 19
6 9 28
7 4 32
8 4 36
9 2 38

Estadística I. 1501 WISA 2020 Pá gina 15


Cálculo de la Mediana:

 Primero hallamos las frecuencias absolutas acumuladas Fi 

Si volvemos a utilizar la fórmula asociada a la mediana para n par,


obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las
frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19

Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde


el vigésimo hasta el vigésimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes

Las principales propiedades de la mediana son:

 Es menos sensible que la media a oscilaciones de los valores de la


variable. Un error de transcripción en la serie del ejemplo anterior en,
pongamos por caso, el último número, deja a la mediana inalterada.

 Como se ha comentado, puede calcularse para datos agrupados en


intervalos, incluso cuando alguno de ellos no está acotado.

 No se ve afectada por la dispersión. De hecho, es más representativa que


la media aritmética cuando la población es bastante heterogénea.

Sus principales inconvenientes son que en el caso de datos agrupados en


intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se
presta a cálculos algebraicos tan bien como la media aritmética.

Estadística I. 1501 WISA 2020 Pá gina 16


Medidas de tendencia central para datos agrupados

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la


media es:

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones


que muestra la tabla. Calcula la puntuación media.

Marc
Frecuenci
 Clase a de
a absoluta FM
s clase
F
M

[10,
15 1 15
20)

[20,
25 8 200
30)

[30,40) 35 10 350

[40,
45 9 405
50)

[50, 60 55 8 440

[60,70) 65 4 260

Estadística I. 1501 WISA 2020 Pá gina 17


[70,
75 2 150
80)

    42 1 820

La media: Σ FM

ΣF

Observaciones sobre la media aritmética

1. La media se puede hallar sólo para variables cuantitativas.


2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas. Si tenemos una
distribución con los siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización poco


representativa de la distribución.

4. La media no se puede calcular si hay un intervalo con una amplitud


indeterminada.

La mediana para datos agrupados

Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor.

 La mediana se representa por Me.


 La mediana se puede hallar sólo para variables cuantitativas.

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega


hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre.

Estadística I. 1501 WISA 2020 Pá gina 18


Formula de la mediana:

Dónde:

 Li: es el límite inferior de la clase donde se encuentra la mediana.

 Es la semisuma de las frecuencias absolutas.


 Fi-1: es la frecuencia acumulada anterior a la clase mediana.
 ai: es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente
tabla:

Frecuenci
Frecuenci a
 Clase a absoluta acumulad
s a
fi
Fi

[60,
5 5
63)

[63,
18 23
66)

[66,
42 65
69)

[69,
27 92
72)

[72, 8 100

Estadística I. 1501 WISA 2020 Pá gina 19


75)

  100  

 100 / 2 = 50
 Clase modal: [66, 69)

La moda para datos agrupados

1. Todos los intervalos tienen la misma amplitud.

Dónde:

 Li: es el límite inferior de la clase modal.


 fi: es la frecuencia absoluta de la clase modal.
 fi—1: es la frecuencia absoluta inmediatamente inferior a la en clase
modal.
 fi-+1: es la frecuencia absoluta inmediatamente posterior a la clase
modal.
 ai: es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

Ejemplo: Calcular la moda de una distribución estadística que viene dada por la
siguiente tabla:

 Clase Frecuencia

Estadística I. 1501 WISA 2020 Pá gina 20


s absoluta fi

[60,
5
63)

[63,
18
66)

[66,
42
69)

[69,
27
72)

[72,
8
75)

  100

2. Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

Estadística I. 1501 WISA 2020 Pá gina 21


La fórmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y


sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.

  fi hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

  50  

Estadística I. 1501 WISA 2020 Pá gina 22


Medidas de dispersión

Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de


arrojar un valor numérico que ofrezca información sobre el grado de variabilidad
de una variable.

Principales medidas de dispersión

Las medidas de dispersión más conocidas son:

 El rango
 La varianza
 La desviación típica y
 El coeficiente de variación.

Rango

El rango es un valor numérico que indica la diferencia entre el valor máximo y el


mínimo de una población o muestra estadística. Su fórmula es:

R = Máxx – Mínx

Dónde:

Estadística I. 1501 WISA 2020 Pá gina 23


R → Es el rango.

Máx → Es el valor máximo de la muestra o población.

Mín → Es el valor mínimo de la muestra o población estadística.

x → Es la variable sobre la que se pretende calcular esta medida.

Varianza

La varianza es una medida de dispersión que representa la variabilidad de una


serie de datos respecto a su media. Formalmente se calcula como la suma de los
residuos al cuadrado divididos entre el total de observaciones.

Su fórmula es la siguiente: Datos no agrupados

 X → Variable sobre la que se pretenden calcular la varianza


 xi → Observación número i de la variable X. i puede tomará valores entre 1
y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.

Datos agrupados

Estadística I. 1501 WISA 2020 Pá gina 24


Desviación típica

La desviación típica es otra medida que ofrece información de la dispersión


respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero
realizando la raíz cuadrada de su resultado. Es decir, la desviación típica es la raíz
cuadrada de la varianza.

Datos no agrupados

 X → Variable sobre la que se pretenden calcular la varianza


 xi → Observación número i de la variable X. i puede tomará valores entre 1
y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.

Datos agrupados

Coeficiente de variación

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la


media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.

 X → Variable sobre la que se pretenden calcular la varianza

Estadística I. 1501 WISA 2020 Pá gina 25


 σx → Desviación típica de la variable X.
 | x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0

Ejercicio

Se toma una muestra de 34 personas de un supermercado para saber cuánto


dinero gastaron en su visita. Los resultados obtenidos son los siguientes:

Lempiras Número de compradores


Clases Frecuencia absoluta
0 500 2
500 1,000 12
1,000 1,500 11
1,500 2,000 6
2,000 2,500 3
Total 34
Pasos a desarrollar:

1. Ordenar los datos ( De menor a mayor) ósea en "orden ascendente "

2. Determinación del número de intervalos o clases.

Formula recomendada para el número de clases

Estadística I. 1501 WISA 2020 Pá gina 26


3. Determinar la amplitud del intervalo, a, se fija aproximadamente como

a = Recorrido/ no de clases

El recorrido de esta variable, R, es:( También llamado Rango)

Recorrido o Rango= Valor máximo – Valor mínimo

R = Valor máximo – Valor mínimo

4. Construir la clase: Limites superior e inferior de los intervalos

Se pide:

a) Encuentre la media, la mediana, la moda, la varianza, coeficiente de variación


y desviación estándar del dinero gastado por los clientes.
b) ¿Le parece que el número de clases es ideal para el número de observaciones
existentes?

Lempiras Compradores Frecuencia


(Clases) (F) M F.M F.M² acumulada
0 500 2 250 500 125,000 2
500 1,000 12 750 9,000 6,750,000 14
1,000 1,500 11 1,250 13,750 17,187,500 25
1,500 2,000 6 1,750 10,500 18,375,000 31
2,000 2,500 3 2,250 6,750 15,187,500 34
Total Σ 34 Σ40,500 Σ57,625,000

M: Marca de clase o punto medio

M: Límite inferior de la clase + Límite superior de la clase

F.M: Frecuencia absoluta x Marca de clase

F.M²: Frecuencia absoluta x Marca de clase al cuadrado

DESARROLLO DEL EJERCICIO DE LOS CLIENTES DEL SUPERMERCADO

Estadística I. 1501 WISA 2020 Pá gina 27


Medidas de tendencia central datos agrupados

 La media: Σ FM : Σ40,500 : 1,191.18


ΣF Σ 34

Dónde:

 Σ FM: Sumatoria de la frecuencia absoluta por punto medio


 Σ F: Sumatoria de la frecuencia absoluta

 La mediana: L MED + ΣF/2 – FA anterior. I


F MED

La mediana: 1,000 + 34/2 – 14 .500

11
La mediana: 1,136.36

Dónde:

 L MED: Límite inferior de la clase mediana.


 ΣF: Sumatoria de la frecuencia absoluta
 FA anterior: Frecuencia acumulada hasta la clase anterior a la
mediana.
 I: amplitud del intervalo o tamaño de clase
 F MED: Frecuencia de la clase mediana

Observación: La clase mediana es la clase que contiene elemento central de la


serie de datos.

 La moda: L MOD + Da .I
Da + Db

La moda: 500 + 10 . 500


10+ 1

La moda: 954.54

Da: 12 – 2 : 10
Db: 12 – 11 : 1
Dónde:
 L MOD: Límite inferior de la clase modal.

Estadística I. 1501 WISA 2020 Pá gina 28


 Da: Diferencia entre frecuencia de la clase modal respecto a la
clase anterior.
 I: amplitud del intervalo o tamaño de clase
 Db: Diferencia entre frecuencia de la clase modal respecto a la clase
posterior

Observación: La clase modal es la que presenta mayor frecuencia.

Medidas de dispersión datos agrupados

La varianza: ΣFM² – (ΣF) ()²


ΣF – 1

 Desviación estándar(S): Es la raíz cuadrada de la varianza

 Coeficiente de Variación: S

Ejercicio Propuesto:

A continuación se le presentan los datos estadísticos relativos a la edad de una


muestra de vecinos de la ciudad de Danlí, para investigar su comportamiento en
cuanto a la variable edad:

77 18 63 84 38 54 50 59 54 56
41 58 58 53 51 62 43 52 53 63
60 60 45 66 83 71 63 58 61 71
36 26 50 34 44 62 62 65 61 52

Calcule:

a) La media aritmética
b) La mediana
c) La moda
d) Las medidas de dispersión

Media Geométrica

Estadística I. 1501 WISA 2020 Pá gina 29


La media geométrica G, de un conjunto de valores es la raíz n-ésima del producto
de los valores de dicho conjunto: Si hay dos valores, la raíz cuadrada del producto
de estos dos; si son tres, es la raíz cúbica del producto de los tres valores. La
fórmula general es:

Ejercicio:

La subida de precios: supongamos que en 3 años los precios de cierto producto


han subido un 10%, un 20% y un 30% ¿Cuánto han subido en promedio? 

Obsérvese que para obtener el precio del primer año (tras una subida del 10%),
tenemos que multiplicar por 1,1 el precio inicial.

Al precio así obtenido tenemos que multiplicarlo por 1,2 (subida del 20%) para
obtener el precio tras el segundo año. Y a dicho precio hemos de multiplicarlo por
1,3 (subida del 30%) para obtener el precio final. Así si el precio inicial es 100, el
resultado final será:

100 x (1,1) x (1,2) x (1,3) = 171,6

Efectivamente si aplicamos cada año una subida del 19,721577 % obtenemos:

100 x (1,19721577) x (1,19721577) x (1,19721577) =171,6

Ejercicio propuesto:

El crecimiento de las ventas en un pequeño negocio son 3%, 4%,8%,9% y 10%,


hallar la media de crecimiento o media geométrica.

Estadística I. 1501 WISA 2020 Pá gina 30


La media ponderada (MP)

Es una medida de centralización. Consiste en otorgar a cada observación del


conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la importancia de
cada elemento.

La media ponderada difiere de la media aritmética en que cada dato tiene mayor o
menor importancia o peso a la hora de calcular la media.

Ejercicio:

Notas y pesos de los cinco exámenes realizados por un alumno:

a) Calcular la nota media ponderada.


b) Si todos los exámenes tuvieran el mismo peso, ¿cuál sería la media
ponderada?

a. Calculamos la media ponderada:

Para simplificar los cálculos, utilizamos los pesos normalizados (dividiendo cada
peso entre 100):

b. Si todas las notas tienen el mismo peso, la media ponderada es la media


aritmética:

Estadística I. 1501 WISA 2020 Pá gina 31


A este alumno en particular, le vendría mejor que la nota final fuese la media
aritmética porque así tendría una nota mayor.

La media ponderada es mayor que la media aritmética porque las dos notas altas
tienen más peso que la otra.

Ejercicio:

El alumno Santiago López obtuvo las siguientes notas durante los cuatro
bimestres:

Bimestre Calificación

1º Bimestre 9.0

2º Bimestre 8.5

3º Bimestre 7.0

4 ° Bimestre 6.0

(9 x 1) + (8.5 x 2) + (7 x 3) + (6 x 4)

1+2+3+4

Media Ponderada = 9 + 17 + 21 + 24

10

Estadística I. 1501 WISA 2020 Pá gina 32


Media Ponderada = 71/10 Media Ponderada = 7.1

La media anual de Santiago, por lo tanto, es 7.1.

Ejercicio Propuesto:

Supongamos que usted desea saber el promedio salarial mensual de todos de la


empresa, incluyendo Presidente, Directores y Gerentes. Para ello, suponga el
siguiente:

Puesto Cantidad Salario

President
1 $ 15.000,00
e

Director 3 8.500,00

Gerente 3 6.000,00

Secretario 3 2.500,00

Aprendiz 6 1.500,00

 ¿Cuál es la media ponderada?

Estadística I. 1501 WISA 2020 Pá gina 33

También podría gustarte