Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

ÁREA EDUCATIVA

CARRERA DE LICENCIATURA EN CIENCIAS DE LA EDUCACIÒN CON


MENCIÒN EN LENGUA Y LITERATURA.

PROGRAMA DE ASIGNATURA

Estadista Aplicada a la Educación.

Docente: José Pedro Aragón González.

I Año.

Celular: 8731 1175.

San Carlos Río San Juan


ASIGNATURA: ESTADISTA APLICADA A LA EDUCACIÓN.

UNIDAD I: ¿QUÉ ES ESTADÍSTICA?

OBJETIVOS ESPECÍFICOS.

Conceptual:

Analizar mediante seminario los conceptos y características de la Estadística a fin de que reconozcan la
importancia de aplicarla en el campo educativo.

Procedimental:

Observar los tipos de estadísticas mediante trabajo investigativo con el objetivo que diferencien los datos
estadísticos cualitativos y cuantitativos.

Actitudinal:

Mostrar interés en la estadística mediante la participación en debates y mesas redondas con la finalidad
de que aprecien la importancia de la misma en la toma de decisiones para la resolución de problemas.

Contenido Temático:
1. ¿Qué es Estadística?: 1.1 Conceptos básicos 1.2 Organización de datos
1.3 Antecedentes 1.4 Características 1.5 Fundamentos filosóficos
1.6 Fundamentos básicos. 1.7 Importancia en su ejecución
2. Tipos de Estadísticas: 2.1 Cualitativas. 2.2 Cuantitativa.
3. Teoría de la probabilidad.
4. Muestreos e inferencia estadística .
1. ¿Qué es Estadística?
Al término Estadística se le asignan diversas acepciones por parte de las personas
vinculadas al campo socioeducativo; así se puede entender como una serie de conjuntos
de números, como método de trabajo propio del campo empírico, como a la forma de
resolver problemas educativos, e incluso, a considerarla como una ciencia.

Entendida como conjunto de datos numéricos propia de los censos de personas que se
ubican en un determinado espacio físico, podemos reseñar las estadísticas sobre los
niveles de escolarización obligatoria, sobre el acceso a los estudios superiores de los
inmigrantes, etc. Desde el otro extremo, al considerarla como ciencia, dirige su atención
al estudio de los fenómenos aleatorios, con este enfoque se ha conseguido avanzar en
el desarrollo de métodos, técnicas y modelos que nos ayudan en la resolución de
problemas pedagógicos y, sobre todo, a la toma de decisiones. La Estadística actúa
como una disciplina puente entre los modelos matemáticos y los fenómenos reales, que,
además, proporciona una metodología para evaluar las discrepancias entre la realidad y
la teoría.

Entre los autores que han definido la Estadística, quizá una de las más completas y
comprensibles nos la ofrece Kerlinger (1985) cuando la define como:

«La teoría y el método de analizar datos cuantitativos obtenidos de muestras de


observaciones, para estudiar y comparar fuentes de variancia de fenómenos, ayudar a
tomar decisiones sobre aceptar o rechazar relaciones hipotéticas entre los fenómenos y
ayudar a hacer inferencias fidedignas de observaciones empíricas»

Para Vélez y otros (2006):

«La Estadística es la ciencia que estudia, mediante métodos cuantitativos, las


poblaciones que se obtienen como síntesis de la observación de unidades estadísticas»

Por lo tanto, cumple un importante papel instrumental de apoyo a la investigación


socioeducativa: nos permite comprender las posibilidades y limitaciones de los trabajos
empíricos y desarrollar un pensamiento crítico y antidogmático en el estudio de la
realidad.
McMillan y Schumacher (2005) señalan que las funciones que puede desempeñar la
Estadística para los pedagogos, educadores sociales o maestros, se pueden concretar
en los siguientes puntos:

— Entender y criticar artículos profesionales.

— Mejorar la evaluación del aprendizaje de los estudiantes.

— Dirigir, incluso a modo de iniciación e informal, trabajos sencillos de investigación,


para ir profundizando a medida que se avanza en los estudios de los grados.

— Entender las propuestas de evaluación de programas socioeducativos, del


profesorado y de las instituciones educativas y sociales.

— Ayudar en la preparación ciudadana y como consumidor de productos, tomando


decisiones bien fundamentadas en datos o argumentos cuantitativos.

— Mejorar la profesión socioeducativa, pues proporciona habilidades de comunicación,


debate, discusión de investigaciones que tengan implicaciones para la práctica social y
educativa.

¿Qué es la estadística?
La Estadística estudia los métodos y procedimientos para recopilar, organizar, presentar
y analizar datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrínsica de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso formular predicciones.

1.1 Conceptos básicos.

Población

Conjunto o cúmulo de individuos u objetos cuyas propiedades se han de analizar.

La población es el conjunto completo de individuos u objetos que interesan a quien


selecciona muestra. El concepto de población es la idea fundamental en estadística.
La población de interés debe definirse cuidadosamente, y se considera definida por
completo sólo cuando se especifica una lista de sus miembros. El conjunto de “todos los
estudiantes que han asistido a la universidad UML” es un ejemplo de población bien
definida.

Generalmente se entiende población un conjunto de personas. Sin embargo, en


Estadística una población puede ser un conjunto de animales u objetos. Por ejemplo, el
conjunto de todos los árboles de la especie almendro en el departamento Río San Juan
es asimismo una población.

MUESTRA

Es una parte de la población que se espera sea representativa de ella. Con frecuencia
usaremos el término muestra para referirnos a los datos muéstrales 𝑋1 , 𝑋2 , …, 𝑋𝑛

VARIABLES:

Utilizaremos variables como X, Y, Z, etc. para representar las características de los


elementos Existen básicamente 2 tipos de variables:

Variables cualitativas: Son las que producen respuestas categóricas. (Atributos o


modalidades)
Variables cuantitativas: Son las que producen respuestas numéricas. (Valores)
Si X representa la edad entonces X es cuantitativa. Si Y representa el sexo entonces Y
es cualitativa.

Las variables cuantitativas pueden considerarse como variables discretas y variables


continúas.

Variables discretas: Son aquellas cuyos valores posibles tienen interrupción (esto es,
se separan sin haber valores intermedios) Por lo general provienen de un proceso de
conteo.

Si Z representa el número de asignaturas que lleva entonces Z es discreta. Variables


continúas: Son aquellas cuyos valores posibles no tienen interrupción. Por lo general
provienen de un proceso de medición.

Si X representa la estatura entonces X es continúa.

DATOS ESTADISTICOS.

Los valores posibles de una característica X los denotaremos por x, mientras que los
valores realmente observados de esa característica X, los llamaremos datos y los
denotaremos por 𝑋𝑖 donde el valor del subíndice nos indica que es la i-ésima
observación de X.

Con frecuencia usaremos el término población para referirnos a la totalidad de datos que
podrían recopilarse en una situación dada.

Estadística:
Característica numérica de una muestra.

La media muestral de un conjunto de datos 𝑋1 , 𝑋2 , …, 𝑋𝑛 se denota y define como:


PARAMETROS:
Es una medida que proviene de todos los datos de la población. Los parámetros son
constantes que representan por lo general características de la población. Generalmente
se representan por letras griegas. Por ejemplo, la media poblacional es un parámetro
que se denota y define como:

1.2 Antecedentes

Las primeras noticias que se tienen de la Estadística datan del año 2 238 a. de J.C. en
que Yao, Emperador de la China, mandó a hacer un censo general en aquel imperio. En
Egipto, y entre los judíos, en los tiempos más remotos, también se formaron inscripciones
regulares de habitantes y más tarde, Roma desarrolló notablemente la institución del
censo; en todos estos pueblos, el objeto primordial de estos registros era aumentar los
tributos y conocer el número de combatientes o efectivos de que disponían para los
combates.

En el siglo XV, todos los pueblos de Europa sintieron la necesidad de conocer la situación
del propio país y la de los demás y entonces empezaron a publicarse las que pueden
llamarse propiamente obras de Estadística.

“El nombre de Estadística alude al enorme interés de esta rama de la matemática para
los asuntos del Estado”

En Francia, en los siglos XVI al XVIII se desarrolló la segunda fuente de la estadística


moderna: Teoría de

Probabilidades, generada por el interés de conocer las posibilidades de ganar y la


ganancia esperada (o la ganancia promedio) en los juegos de azar entre los jugadores
profesionales, que mayoritariamente era la clase acomodada y la nobleza de la época.
Los aportes más valiosos a esta teoría fueron hechos por Blaise Pascal.

(1623-1662) y Pierre Fermat (1601-1665).

En los primero decenios del siglo XIX, otros dos matemáticos, Laplace y Gauss, realizaron
importantes trabajos sobre el cálculo de probabilidades aplicadas a la astronomía. Quetelet,
estadístico belga muy famoso aplicó dicha ciencia a los problemas sociales y educativos
pero Francis Galton le superó ejerciendo una mayor influencia con la aplicación de la
Estadística a las Ciencias Sociales y en los estudios de la Herencia, Sociología y muchas
otras ciencias

En el siglo XX se introducen nuevas técnicas y métodos en el estudio de muestras


pequeñas. Las principales contribuciones en este campo las realizó el estadístico inglés R.
A. Fischer. Aun cuando sus trabajos fueron en el campo agrícola y biológico no transcurrió
mucho tiempo para que los científicos reconocieran su utilidad y aplicaran sus ideas.
Actualmente, la estadística se ha convertido en una base científica esencial en todas
las ciencias.

Características de la estadística.

Algunas de las características de la estadística son:

• Es una rama de las matemáticas que se encarga de recopilar y analizar la


información de datos proporcionados.
• Estudia los comportamientos de una sociedad o de una población.
• Facilita la toma de decisiones.
• Mejora la comprensión de los hechos mediante la recolección de datos numéricos.
• Se estudian problemas científicos, sociales e industriales.
DIVISION DE LA ESTADISTICA
ESTADÍSTICA DESCRIPTIVA:
Es la parte de la estadística que estudia los métodos de recopilación, organización,
presentación y caracterización o análisis de un conjunto de datos.
ESTADÍSTICA INFERENCIAL.
Estudia los métodos que hacen posible la estimación de un parámetro en base a datos
muéstrales.

EJEMPLOS DE ESTADÍSTICA INFERENCIAL:

1. Los estudiantes que obtuvieron un IQ de inteligencia sobre 120, probablemente


obtendrán sobre 70 puntos en cada área de la prueba de ingreso para ingreso a la
universidad.

2. Si aún hay un 11% de los electores indecisos y si la población electoral es de cerca


de 88 millones electores, quiere decir que aún hay cerca de 10 millones de electores
quienes realmente decidirán cuál va a ser el candidato ganador. En estos dos ejemplos
se lleva a cabo una deducción lógica basada en unos datos estadísticos de una muestra,
pero la inferencia o deducción que se utiliza para generalizar una observación sobre la
población requiere de unos cómputos y análisis estadísticos que van más allá de los
números obtenidos de la muestra. La deducción o inferencia debe ser comprobada para
aceptarse como confiable y válida, por lo tanto, esto requiere un procedimiento
estadístico mucho más complejo el cuál compete a la estadística inferencial.

Teoría de la Probabilidad.

Estimar los parámetros del modelo supuesto a partir de las observaciones muestrales
utilizando los métodos de Inferencia Estadística: estimación puntual, estimación por
intervalos de confianza y contrastes de hipótesis paramétricos.

Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se


verifican las hipótesis supuestas en el estudio, por ejemplo, que las observaciones
muestrales son independientes, que no existen observaciones erróneas,...,etc. Para ello
se utilizan los métodos de

Muestreos e inferencia estadística .

Marco de Muestreo
Es una lista de elementos pertenecientes a la población de donde extrae la muestra.

El marco de muestro debe ser idéntico a la población. De manera ideal el marco debe enlistar cada
elemento de la población sólo una vez. Sin embargo, no siempre es posible porque resulta
impráctico o imposible seleccionar la población total en forma directa. Es importante que el
marco de muestreo sea representativo de la población, ya que sólo los elementos del marco
tienen oportunidad de ser seleccionados como parte de la muestra.

Una vez establecido un marco de muestreo representativo, es posible proceder a seleccionar los
elementos muestrales a partir de dicho marco. Este proceso de selección es definido por el diseño
de la muestra.

Diseño de la Muestra o Plan de Muestreo


Es el conjunto de procedimientos utilizados para seleccionar los elementos de la
muestra.

Hay muchos tipos de diseño de la muestra. Sin embargo, todos ellos producen muestras que se
clasifican en dos categorías: no probabilísticas y probabilísticas.

Muestras No Probabilísticas
Son las que se seleccionan a partir de su consideración como “Típicas”.

Una persona obtiene una muestra no probabilística cuando elige elementos que, en su opinión, son
representativos de la población. La validez de los resultados obtenidos con una muestra no
probabilística refleja la solidez de quien la selecciona.
Muestras Probabilísticas
Son las muestras donde los elementos por seleccionar se toman de acuerdo con leyes
probabilísticas. Cada elemento en una población tiene cierta probabilidad de ser
seleccionado como parte de la muestra.

Nota: Los procedimientos de la Estadística Inferencial (contraste de hipótesis y estimaciones


mediante intervalos de confianza) requieren muestra probabilísticas.

A continuación se verán algunos de los diseños de muestras más simples y sencillos de emplear.
El muestreo aleatorio simple es uno de los métodos utilizados con mayor frecuencia para
seleccionar muestra probabilísticas.

Muestras Aleatoria Simple


Es aquella seleccionada de manera que cada elemento de la población tiene la misma
probabilidad de ser seleccionado. De manera equivalente, todas las muestras de tamaño
n tienen la misma probabilidad de ser seleccionadas.

Debe realizarse el esfuerzo necesario para asegurar que cada elemento tenga igual probabilidad de
ser seleccionado cuando se extrae una muestra aleatoria simple. A menudo se cometen errores
porque el término aleatorio (con probabilidad igual) se confunde con fortuito (sin un patrón
definido). El empleo de un generador de números aleatorios o de una tabla de números aleatorios
es el procedimiento idóneo para seleccionar una muestra aleatoria simple. Se elige, para integrar
la muestra cada elemento numerado en el marco de muestreo que corresponda a un número
aleatorio seleccionado.

Ilustración 3: El señor Antonio Cerros quien trabaja en el departamento de servicios escolares, ha


obtenido un listado de computadora acerca de los estudiantes de tiempo completo inscritos en el
primer semestre. Hay 4265 nombres en la lista. El señor Cerros numeró a los estudiantes como
sigue: 0001, 0002, 0003,...., 4265. Así, utilizando números aleatorios de cuatro dígitos, él
identificó una muestra.

Muestras Sistemática
Es aquella donde se selecciona todo k – ésimo elemento en el marco de muestreo después
de una inicio aleatorio entre los primeros k elementos.

Este método de selección utiliza la tabla de números aleatorios sólo una vez, para encontrar el
punto inicial (el primer elemento que se observa).

Muestras Estratificada
Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando
después un número fijo de elementos de cada estrato mediante un muestreo aleatorio
simple.

Cuando se de ha de tomar una muestra estratificada la población se subdivide en varios estratos,


extrayéndose luego un submuestra de cada estrato. Dichas submuestras pueden seleccionarse de
cada estrato aleatoria o sistemáticamente. Las submuestras se analizan en forma separada y,
posteriormente, se combina toda la información para obtener conclusiones acerca de toda la
población.

Otro método de muestreo en el que se hace una estratificación de la población es el muestreo por
conglomerados.
Muestra Por Conglomerado
Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando
después todos los elementos de algunos estratos (no todos los estratos.)
La muestra por conglomerado se obtiene utilizando números aleatorios, o un procedimiento
sistemático para identificar primeramente los estratos (conglomerados) que serán muestrados, y
empleando después todos los elementos que se encuentran en dichos estratos.
Ejercicios Propuestos.

1. Un fabricante de medicamentos desea conocer la proporción de personas cuya


hipertensión (alta presión sanguínea) puede ser controlada con un nuevo producto
fabricado por la compañía. Al realizar un estudio en 5000 individuos hipertensos
se encontró que 80% de ellos pudo controlar su hipertensión utilizando el nuevo
medicamento. Suponiendo que esas 5000 personas son representativas del grupo
de pacientes de hipertensión, conteste las siguientes preguntas.
a. ¿Cuál es la población?
b. ¿Cuál es la muestra?
c. Identifique el parámetro de interés.
d. Identifique la estadística e indique cuál es su valor.
e. ¿Se conoce el valor del parámetro?
2. Un técnico de control de calidad selecciona partes de una línea de ensamblaje y
anota para cada una de ellas la siguiente información:
a. Si está defectuosa.
b. El número de identificación de la persona que armó la pieza.
c. El peso de la pieza.
Clasifique las respuestas para cada parte como atributo, dato de variable discreta, o
dato de variable continua.
3. Identifique cada uno de los siguientes casos como ejemplo de variable: (1) de
atributo, (2) discreta, o (3) continúa.
a. La resistencia a la ruptura de un determinado tipo de cuerda.
b. El color del cabello de los niños que estén viendo por televisión una
película.
c. El número de señales de tránsito en poblados con menos de 500
habitantes.
d. Si un borrador esta defectuoso.
e. El número de preguntas contestadas correctamente en un examen.
f. El tiempo que se necesita para contestar una llamada telefónica en una
oficina de bienes del MINED.
4. Identifique cada uno de los siguientes casos como ejemplos de variable: (1) de
atributo, (2) discreta, o (3) continúa.
a. El resultado de la encuesta hecha a un grupo de votantes posibles acerca
del candidato de su preferencia.

b. El tiempo necesario para que una herida cicatrice cuando se utiliza un


nuevo medicamento.

c. El número de llamadas telefónicas recibidas en un conmutador cada 10


minutos.

d. La distancia a la que puede llegar un balón de fútbol al ser pateado por las
jóvenes de primer año de inglés.

e. El número de páginas escritas por cada trabajo en una impresora de


computadora.

f. La clase de árbol utilizado como símbolo navideño.

5. Señale con una A las series constituidas por datos cualitativos (o atributos) y con
una V los datos cuantitativos.

a) Preferencia política (izquierda, derecha o centro). ( )


b) Marcas de galletas ( )
c) El peso en libras ( )
d) Velocidad en km/h ( )
e) Nivel educativo (primario, secundario, universitario) ( )
f) Número de estudiantes en un colegio . ( )
g) Años de antigüedad laboral. ( )
h) La clase social (bajo, media o alta) ( )
6. Señale cuál de las siguientes variables son continuas (C) y cuales son discretas (D).

a) Cantidad de quintales de café cortados . ( ) b) Cantidad


de cajas de fósforos en un determinado conteo físico ( ) c) Galones de gasolina
consumidos por un automóvil en una semana ( ) d) Cantidad de camisas vendidas
diariamente ( ) e) Tiempo de vida de los bombillos eléctricos
( )

1. ¿Qué es un marco de muestreo?

Considere una población sencilla que se compone únicamente de los enteros 1, 2 y 3 (con un
número ilimitado de cada uno). Pueden seleccionarse nueve muestras distintas de tamaño 2
(dos dígitos) de esta población: (1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3).

Si la población consta de los números 1, 2, 3 y 4, enliste todas las muestras posibles de tamaño
2 que podrían seleccionarse.

Si la población se compone de los números 1, 2 y 3, enliste todas las muestras posibles de


tamaño 3 que podrían seleccionarse.

UNIDAD II. ESTADÍSTICA Y EDUCACIÓN

Conceptual:

1. Estudiar con mucho esmero la importancia de la Estadística y la Educación, ya que ambas son de vital importancia en el
ejercicio previo a la Enseñanza

Procedimental:

2. Interpretar de manera directa las similitudes y diferencias de Estadísticas y Educación, partiendo de de la información actual

Actitudinal:

3. Asumir con madurez la importancia que tiene el orden de la Educación y su realización a la hora de aplicarlo.
Contenido Temático:
1. Estadísticas actuales de la Educación:

1.1 Conceptos
1.2 Características
1.3 Importancia de la estadística en función de la educación
1.4 Ejercicios estadísticos de la Educación
1.5 Manejo actual de estadísticas en Educación
1.6 Hojas actuales utilizadas en estadísticas educacionales

1.1 Conceptos
La estadística resulta fundamental, por lo que ha adquirido un papel clave en la
investigación. Se usa como un valioso auxiliar y en los diferentes campos del
conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar
información basada en datos cuantitativos.
La Estadística es la ciencia cuyo objetivo es reunir información cuantitativa concerniente
a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos
datos unos significados precisos o unas previsiones para el futuro

OBJETIVOS DE LA ESTADÍSTICA EN LA EDUCACIÓN Comprender los datos a base


de la percepción social Analizar desde el punto de vista crítico de los contextos
educativos y sociales. Comprender que la educación se basa en el contexto científico,
para lo cual su estudio cualitativo y cuantitativo es fundamental. Valorar las herramientas
para prestar servicio profesional como cientista en educación.

¿POR QUÉ LA ESTADISTICA ES IMPORTANTE EN LA EDUCACIÓN? La estadística


es importante porque en el área de educación se aplica frecuentemente. Enfocándonos
en el ambiente educativo, el campo ocupacional del Licenciado en Ciencias de la
Educación comprende tanto actividades en el campo de la enseñanza media, superior o
universitaria, como así también en ejercicio de la investigación el planeamiento y
programas educativos la administración efectiva de instituciones educativas y sociales.
Estos planes y programas oscilan en torno a un grupo de estudiantes, a un contenido
educativo, a un centro docente, una comunidad, una sociedad, entre otras, por tal motivo
es indispensable conocer la estadística.
UTILIDAD DE LA ESTADÍSTICA la Estadística brinda herramientas insustituibles para
comprender la dimensión macro estructural de la educación y sus vinculaciones con el
sistema social global, con cierta independencia de los cambios inmediatos y mediatos
que se buscan desde la función pública y privada. Todo esto. Induce a las conclusiones
y toma de decisiones. En el campo del Planeamiento de la Educación En las
investigaciones y desarrollo de proyectos.

Pero además… Deben manejar otras estadísticas, como las que se refieran a  La salud
de los estudiantes,  Cuáles son las enfermedades más frecuentes que padecen, 
Estadísticas sociales, como lugar donde viven, con quien viven  Estadísticas
demográficas referidas a la población de la comunidad y su estructura por sexo y edad,
número de hermanos/as, niños/as en edad escolar  Los CENSOS Estadísticas que
periódicamente se originan en los ministerios de educación, constituyen “registros
continuos”.  Cantidad de alumnos en primaria, secundaria y nivel terciario o universitario
Indican nivel de conocimiento.  Identifican cantidad de alumnos que asisten a
establecimientos privados o públicos.  Identifican qué asignaturas presentan más
dificultades para los niños y jóvenes Utilizar los recursos estadísticos que son una
manifestación del resultado de desarrollo educativo se podría obtener mejores productos
en el proceso de enseñanza-aprendizaje.

La Estadística es una herramienta importante para quienes estudiamos educación y


áreas sociales, saber su correcta utilización nos facilitará nuestro trabajo profesional y
formación académica. En la enseñanza-aprendizaje, donde se priorice el uso de casos
reales para tratar temas de estadística consideramos que será de gran utilidad para
comprender de mejor manera la importancia de esta área.

Es importante valorar el papel de la estadística a base de todas sus herramientas


fundamentales. Si es posible en la carrera de educación y sociales, la estadística debe
ser pilar fundamental en su plan curricular.
Construcción de Variables a partir de información.

Para poder analizar datos, ya sea de forma manual o por computadora, hay que entender
que trataremos a partir del estudio de la realidad observable crear un modelo numérico
teórico donde se estudian variables para describirlas y analizar sus relaciones. Para
hacer esto primero es necesario definir algunos términos teóricos.

Variable: es una característica observable de un objeto y que varía. Las variables se


pueden clasificar de diferentes maneras, un enfoque es reconocer dos grandes grupos
de variables las Cualitativas y Cuantitativas.

Variables Cualitativas, son aquellas que se ordenan en categorías debido a su carácter


subjetivo y absoluto, pueden ser de dos tipos “nominales”, u “ordinales”. En las variables
nominales los valores no pueden ser sometidos a un criterio de orden o importancia
como por ejemplo “el sexo de una persona” o “el país de origen”. Las variables ordinales
pueden tomar distintos valores ordenados siguiendo una escala establecida, aunque no
es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve,
moderado, grave.

Variables Cuantitativas, son las que sus características están expresadas en valores
numéricos, éstas asumen cualquier valor y pueden variar en cualquier cantidad, sobre
una escala aritmética e infinita y pueden subdividirse en dos tipos “continuas o
medibles” y “discretas o contables”.

Las variables continuas pueden adquirir cualquier valor dentro de un intervalo


especificado de valores, permite siempre que se encuentre un valor nuevo entre dos
valores previos. El rendimiento de un lote de fríjol se mide en qq/mz es una variable
continua, se mide o pesa.
Las variables discretas presentan interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir por número de miembros de una familia es una variable
discreta, se cuenta y entre dos personas no hay un valor intermedio, no existe 1.5 personas . Los
atributos, en control de calidad, son variables discretas.

Las variables generan “datos”, con ellos se hace la estadística y cada uno de éstos ocupa
una celda de una matriz o base de datos. La Matriz de datos es un ordenamiento de
datos en fila y columnas donde cada fila es un individuo, una parcela, una muestra, una
unidad experimental o una encuesta determinada y cada columna: una variable. Los
programas Access, Excel, Infostat y SPSS ordenan los datos en forma de matriz. Por
ejemplo en una encuesta (cuestionario) cada pregunta que se tiene, genera al menos,
una variable generalmente discreta. Hay casos donde una pregunta puede generar
muchas variables de tipo dicotómico, SI- NO, que se suele codificar como 1= SI y 0=
NO.

Ejercicio 1.1: Construya variables relacionadas con su entorno, 5 nominales, 5


ordinales, 5 continuas y 5 ordinales.

Ejercicio 1.2 Clasifique las siguientes variables.

• Peso de un estudiante.
• Diámetro de una casa.
• Color de ojos.
• Tipo de techo.
• Vida útil de un monitor
• # de ladrillos de una pared.
• Belleza de una flor.
• Temperatura semanal.
• Largo de peces de un estanque.
• Diámetro de un tornillo
Análisis de datos, TDF y Gráficos

A partir de la realidad observable se debe crear un modelo numérico


teórico para intentar estudiar ésta realidad”

Una vez que los datos se han codificado, transferidos a una matriz y guardado en una
computadora podemos proceder a analizarlos, proceso que se hace con un programa
estadístico como SPSS o INFOSTAT, de forma manual solo se pueden manejar pocos
datos y variables es por ello que el énfasis de este libro está más en la interpretación
de resultados que en los procedimientos de cálculo.

El procedimiento de análisis sugerido se esquematiza en la figura siguiente:

En general el investigador debe buscar de primero cómo describir sus datos y


posteriormente efectuar el análisis estadístico para relacionar las variables generadas.
Los tipos de análisis son variados y cada método tiene su razón de ser un propósito

Específico, “la estadística no es un fin en sí misma, sino una herramienta para


analizar datos”.
Los principales análisis que pueden efectuarse son:
• Estadística descriptiva de las
“la estadística está ligada a la toma,
variables.
organización, presentación y análisis de
• Pruebas de hipótesis para la toma de
un grupo de datos”.
decisiones.

Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando información atípica o anormal y corregir los casos que la información atípica
se deba a una mala digitación o error en la recolección de datos.
Lo siguiente para observar el comportamiento de los datos es realizar una “distribución
frecuencias” en forma de tabla y gráficos. Para esto, los datos se agrupan en clases o
categorías y para grupo se calcula las frecuencias absolutas y relativas.

En este momento es importante poder definir el tipo de escala de medición usada,


sucesión de medidas que permite organizar datos o para agrupar los datos, en este
sentido se pueden reconocer diferentes escalas:

• Las Escalas Nominales, son discontinuas y se usan cuando describimos algo


dándole un nombre a cada categoría o clase y estas son mutuamente excluyentes.
A cada categoría se le adjudica un valor numérico. Por ejemplo la variable sexo
donde “varón = 1” y “mujer = 2”.
• Las Escalas Ordinales, son discontinuas y se usan donde hay un orden jerárquico
de un conjunto de objetos o eventos con respecto a algún atributo específico, por
ejemplo ordenar los ingresos en tres niveles: “alto =1”, “medio = 2” y “bajo = 3”.
Las Escalas de Intervalos Iguales, estas pueden ser sumadas, restadas multiplicadas y
divididas sin afectar las distancias relativas entre las calificaciones. Por ejemplo las
medidas de temperatura en Grados C0, las calificaciones de un examen en una escala
de 1 a 100. En esta escala el “0” es arbitrario y no necesariamente representa ausencia,
también nos dice que un valor de 30 puntos de un examen de español no necesariamente
representa la mitad de conocimiento de un valor de 60 puntos.

• Las Escala de Razón Constante, tienen todas las propiedades de las Escalas de
intervalos más un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor “0” representa ausencia del valor.
• Un caso especial de escala ordinal es la escala de Likert, esta escala es muy usada en las ciencias
sociales y se usa para medir actitudes, “Una actitud es una predisposición aprendida
par responder consistentemente de una manera favorable o desfavorable ante un
objeto de sus símbolos”. Así las personas tenemos actitudes hacia muy diversos
objetos o símbolos, por ejemplo: actitudes hacia la política económica, un profesor,
la ley, nosotros, etc. Las actitudes están relacionadas con el comportamiento que
mantenemos. Estas mediciones de actitudes deben interpretarse como “síntomas” y
no como hechos. Esta escala es bipolar porque mide tanto el grado positivo como
negativo de cada enunciado y consiste en un conjunto de ítem presentado en forma
de afirmaciones o juicios ante los cuales se pide reacción a los sujetos en estudio
en una escala de 5 puntos, cada punto tiene un valor numérico. Un ejemplo de cómo
calificar con afirmaciones positivas es ¿Le gusta cómo se imparte la clase de
estadística?: 1- Muy en desacuerdo, 2- En desacuerdo, 3- Ni de acuerdo, ni en
desacuerdo, 4- De acuerdo, 5-Muy de acuerdo.
• Estar de acuerdo con la idea presentada significa un puntaje mayor.

Organización de una matriz de información a partir de un cuestionario.


Una encuesta impersonal con preguntas cerradas es una manera de recolectar
mucha información rápidamente que luego se puede codificarla fácilmente, la
debilidad de este instrumento es que no siempre la gente responde adecuadamente
y que las respuestas generadas se limitan a las opciones previamente definidas y
la experiencia nos dice que la realidad es mucho más rica que lo que creemos ocurre
a priori. Para los que trabajan con entrevistas hay que saber que también la
información que se genera de las entrevistas puede luego tabularse numéricamente
de la misma manera que una encuesta.

Encuestas o Cuestionarios: Al diseñar una encuesta esta debe ayudar a responder a


las preguntas que genera la hipótesis del trabajo, un error común es hacer una encuesta
primero y luego que se han recolectado los datos, se solicita a un estadístico que no
ayude a analizar la información, “la lógica es al revés” se debe pensar como se analizará
la información desde el mismo momento que se diseña la encuesta. Se sugiera que las
variables cualitativas (ej. nombres) se deben recodificar al momento del llenado de la
base de datos creando variables numéricas discretas, por ej. Si quiero clasificar las
becas que otorga una Universidad puedo codificarlas de la siguiente manera: Beca
interna =1, Beca externa =2 y No beca =0.
Si las opciones que genera una variable discreta permite hacer combinaciones de las
respuestas se sugiere crear muchas variables dicotómicas del tipo Si o No (1,0).
Veamos un ejemplo: Si se pregunta: que prácticas de en los cultivos realiza un
campesino, estas pueden ser varias y combinadas como: Insecticidas Botánicos,
Trampas amarillas, Barreras vivas, Semilla resistente etc. En este caso lo que se hace
es generar un variable del tipo 0-1 para cada opción de práctica de cultivo, generando
muchas variables en una sola pregunta.

Para crear una base de datos hay que recordar que se está obteniendo una matriz de
datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto
de las filas los datos para cada encuesta o individuo en estudio. Las variables
cualitativas se deben recodificar, veamos el siguiente ejemplo hipotético de 8 encuestas:

Esta matriz se codifica así: la variable “Sexo”: 1= varón, 2 = mujer. Para la variable
“comunidad” hay 4 tipos diferentes donde: 1= San Carlos, 2= San Miguelito, 3= El
Castillo y 4= Morrito y para “Labor realizado”: 1= en otra finca, 2= en la cuidad y 3= en
la propia finca.

De esta manera se transforma en datos numéricos una información descriptiva, estos


números permiten luego hacer estadística.
Ejercicio 1.4: Intente codificar numéricamente las respuestas que se generan a partir
de la encuesta de caracterización socioeconómica, que a continuación se detalla,
discuta las posibles respuestas, diga si las preguntas están bien formuladas, sugiera si
alguna de ellas está de más y que preguntas propone para completar la información.

Hoja de Encuesta
Número de ficha___________
Fecha: ______________________________________________________
Primer Apellido_______________________________________________
Segundo Apellido______________________________________________
Nombres:_____________________________________________________
Año____________
Dirección: _____________________________________________________
Estado Civil: ____________
Número de personas que habitan la vivienda__________________________
Nivel de estudio de ellos__________________________________________
Edad de cada una de ellos_________________________________________
Profesión: _____________________________________________________
Ejercicio 1.5:
Defina variables para caracterizar a los estudiantes del curso con el objetivo de
determinar posibles causas que tengan influencia en el rendimiento académico del grupo.

Cree una base de datos de al menos 25 individuos. Ver ejemplo.

Ejemplo de una matriz de datos generados con datos de estudiantes.

Códigos: Estado Civil: 1 Soltero, 2 Casado; Origen: 1 San Carlos, 2 No dé San Carlos ;
Sexo: 1 Varón, 2 Mujer; Becas: 1 Si 2 No; Opinión: 1 Negativa 5 Positiva
Distribución de frecuencia para datos libres.
La frecuencia absoluta f es el número de veces que ocurre el valor de x en la
muestra. Esta es una distribución de frecuencias no agrupada. “
Ejemplo 1.
Distribución de frecuencias del número de días de atraso en el pago de 10
cuentas de crédito.

Fa Frecuencia relativa
𝒇𝒂
𝒇𝒓 = 𝒏

X fr %fi
No de días No dé cuenta
0 2 0.2 20
1 3 0.3 30
2 4 0.4 40
3 1 0.1 10
10 1 100

Fuente: BANPRO.

DATOS AGRUPADOS EN CLASES


Introduciremos primero algunos conceptos:

Un intervalo de clase o simplemente clase se denota y define como:

Donde Li el límite inferior y Ls es el límite superior de la clase.


Una clase de extremo abierto es la que no especifica uno de sus límites y la
denotaremos así:

Amplitud o tamaño de un intervalo de clase.

Amplitud o tamaño de un intervalo de clase


C= Ls- Li.
Punto medio de un intervalo de clase o marca de clase
𝐿𝑖+𝐿𝑠
𝑥𝑖 = 2
Determinar el rango o amplitud de la muestra.

R= H-L.
El número de clases es: M= 1+3.3log(n) ó R= √𝑛
𝑅
La amplitud de clase es el cociente entre el rango y la marca de clase: A=
𝑀
Ls ultima clase= Li primera clase + MC

2.1.3 Distribución de frecuencia relativas.


fi : frecuencia ( absoluta ) de la clase. fa : frecuencia acumulada.
fr. frecuencia relativa de la clase

𝑓𝑖
𝑓𝑟 = Ecuación para calcular la frecuencia relativa de clases.
𝑛
El límite inferior de clase es el valor más pequeño que puede asignarse en
cada clase. Límites superiores de clase son los valores de mayor magnitud
que pueden asignarse a cada clase. En el presente ejemplo las clases son:
Lri de una clase es 0.5 unidad menos que el Li de clase y el Lrs es 0.5 unidad
más que el Ls de clase. Si lo límites de clase es un numero con un digito decimal
se resta y se le suma Li y Ls 0.05 al Lri y Lrs y asi sucesivamente.
Frecuencia absoluta: número de veces que se repite un mismo valor.
Frecuencia porcentual de clase: es la frecuencia de una clase, expresada como
porcentaje y la denotamos f %.
Frecuencia absoluta acumulada: suma de todas las frecuencias absolutas de
valores menores o iguales al considerado: Se denota 𝑓𝑎
Frecuencia porcentual acumulada: Suma de los porcentajes de frecuencia
acumulada se denota 𝑓𝑎%
EJEMPLO 1.1
Los siguientes datos corresponden a consumos mensuales registrados (en
cienes de córdobas) en 30 familias del barrio Costa Rica.

Tabla 1.1 Datos originales de los consumos mensuales

24 16 26 31 17 25 17 23 23 19 21 17 13
20 30 24 19 22 21 18 25 14 29 20 26 15
27 21 22 23

Fuente: Encuesta realizada por INEC

Ordenar los datos

13 14 15 16 17 17 17 18 19 19 20 20 21 21
21 22 22 23 23 23 24 24 25 25 26 26 27 29
30 31

El número de clases es: M= 1+3.3log(n) → M= 1+3.3log (30) → M= 5.87→ M= 6


𝑅
La amplitud de clase es el cociente entre el rango y la marca de clase: A= →
𝑀
18
sustituyendo nos queda: A= →A=3.
6

Clases Li-Ls fi fr Xi Lri-Lrs %fi fa %fa


1 13-15 3 0.1 14 12.5-15.5 10 3 10
2 16-18 5 0.17 17 15.5-18.5 17 8 27
3 19-21 7 0.23 20 18.5-21.5 23 15 50
4 22-24 7 0.23 23 21.5-24.5 23 22 73
5 25-27 5 0.17 26 24.5-27.5 17 27 90
6 28-30 2 0.07 29 27.5-30.5 7 29 97
7 31-33 1 0.03 32 30.5-33.5 3 30 100
total 30

𝑓𝑖 3
fr= 𝑛 → fr=30 →fr= 0.1

𝑓𝑖𝑥100 3𝑥100
%𝑓𝑟 = →%𝑓𝑟 = →%𝑓𝑟 = 10
𝑛 30

Conteste las siguientes preguntas:


1. ¿Cuántas familias tienen un consumo entre 16 y 24?

2. ¿Qué proporción de familias tienen un consumo entre 19 y 24?

3. ¿Cuántas familias tienen un consumo inferior a o igual 27?

4. ¿Qué proporción de familias tienen un consumo inferior o igual a 24?

Ejercicio Propuesto.
1) Para cada grupo de datos construya una tabla de distribución de frecuencia para
datos agrupados:

13.7 13.7 15.6 11.3 11.7 11.2 13.9

14.0 10.5 12.4 11.2 12.8 11.4 15.1

2) Se utilizó un contador Geiger electrónico para contar el número de emisiones


radiactivas en un período de 10 segundos. El experimento fue repetido 22 veces,
obteniéndose las cuentas siguientes:

8 23 18 22 22 15 21 23 25 18 24

22 21 37 19 22 22 12 27 16 26 32

Construya una tabla de distribución de frecuencia para datos no agrupados


3) En el primer día de clases del trimestre pasado se preguntó a 50 estudiantes
de administración y contabilidad acerca de la distancia que recorren de su casa
a UPF, en km. Los resultados fueron los siguientes.

20 20 30 25 20 25 30 15 10 40

35 25 15 25 25 40 25 30 5 25

25 30 15 20 45 25 35 25 10 10

15 20 20 20 20 25 20 20 15 20

5 20 20 10 5 20 30 10 25 15

Construya una tabla de distribución de frecuencia para datos agrupado

4) Los cambios porcentuales mensuales en el índice de precios al consumidor


después del 10 de enero del presente año y en los doce primeros días fueron:

0.7 1.0 0.6 0.4 0.7 0.7 1.2 0.8 1.2 0.4 0.5 0.4

Elabore una distribución de frecuencias para datos no agrupados

5) Las edades de 50 bailarinas que se presentaron a un concurso de


selección para comedia musical fueron:

21 19 22 19 18 20 23 19 19 20
19 20 21 22 21 20 22 20 21 20
21 19 21 21 19 19 20 19 19 19
20 20 19 21 21 22 19 19 21 19
21 19 18 22 21 24 20 24 17 18

a) Construya una distribución de frecuencias para datos libres de estas edades.

6) se aplicó una encuesta donde se le pide indicar el número de amigos o


parientes que visitan cuando al menos una vez al mes. Resultado.
0 0 1 1 2 2 2 2 2 2 2 2 2
3 3 3 3 3 3 3 3 3 3 3 3 3
3 4 4 4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 5 5 6 6 6 6 7 8
a) Construir una tabla de distribución de frecuencia para datos agrupado
También presentaremos los datos por gráficas, en las cuales tomaremos en el
eje horizontal la característica de interés x y en el eje vertical las frecuencias.
Debemos tener cuidado en la selección de las unidades en los ejes: Regla de los
3/4 La altura del punto correspondiente a la mayor frecuencia debe ser
aproximadamente igual a los 3/4 del eje horizontal.
La siguiente tabla representa los datos de consumos mensuales registrados
(en cienes de córdobas) en 30 familias de la zona # 5 de Nueva Guinea.

Clases Li-Ls fi fr Xi Lri-Lrs %fi fa %fa


1 12-16 4 0.13 14 12.5-16.5 13.33 4 13.33
2 16-20 8 0.27 18 16.5-20.5 26.67 12 40
3 20-24 10 0.33 22 20.5-24.5 33.33 22 73.33
4 24-28 5 0.17 26 24.5-28.5 16.67 27 90
5 28-32 3 0.10 30 28.5-32.5 10.00 30 100
Total - 30 - - - 100 30 100

HISTOGRAMA DE FRECUENCIAS / HISTOGRAMA DE FRECUENCIAS


RELATIVAS
Ubicamos en el eje horizontal los límites inferiores y superiores de cada clase.
Dibujamos rectángulos tales que las longitudes de las bases correspondan a los
tamaños de las clases y las alturas sean las correspondientes frecuencias de las
clases.
POLÍGONO DE FRECUENCIAS:
Se forman haciendo que cada marca de clase represente los datos de esa clase.
Luego se toman las frecuencias correspondientes a cada marca de clase para
después unir los puntos resultantes con segmentos. Algunos prolongan el
polígono hasta las marcas de clase imaginarias inferior y superior inmediata

GRAFICA DE BARRAS:
Este gráfico está constituido por un conjunto de barras o rectángulos, separados
por distancias iguales, cuyas alturas son el valor de los datos correspondientes
al atributo que señalan sus bases.

Fuente: Banco Central


GRAFICA DE PASTEL O SECTORES:
Se construyen en base a un círculo que representa el valor total de las distintas
categorías en que se divide un atributo, dividido este círculo en tantos sectores
circulares como categorías tenga el atributo. La magnitud del ángulo de los
sectores se calcula con la siguiente fórmula:

𝑓𝑖𝑥360
Angulo de sector= 𝑛
Ojiva:
Ubicamos en el eje horizontal los límites superiores de todas las clases. Algunos
prolongan el polígono hasta el límite superior imaginario de la clase imaginaria
inferior inmediata.

La siguiente tabla representa los datos de consumos mensuales registrados


(en cienes de córdobas) en 30 familias de la zona # 5 de Nueva Guinea.

Clases Li-Ls fi fr Xi Lri-Lrs %fi fa %fa


1 12-16 4 0.13 14 12.5-16.5 13.33 4 13.33
2 16-20 8 0.27 18 16.5-20.5 26.67 12 40
3 20-24 10 0.33 22 20.5-24.5 33.33 22 73.33
4 24-28 5 0.17 26 24.5-28.5 16.67 27 90
5 28-32 3 0.10 30 28.5-32.5 10.00 30 100
Total - 30 - - - 100 30 100

Ejercicios propuestos.

1. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar cada una
de sus cuentas de créditos. Se han obtenido los siguientes 30 registros:

a) Construya una distribución de frecuencias para datos agrupados.

b) Grafique el histograma, el polígono de frecuencias y la ojiva.


2. La gran variedad de factores a considerar en la compra de una vivienda, lugar, precio, tasa de
amortización, tipo de construcción y otros hacen que el tiempo que un comprador tarda en
llegar a su decisión final sea muy variable. Los siguientes datos representan la duración de la
búsqueda (en semanas) de 25 compradores de vivienda en cierta población.

a) Construya un histograma de frecuencias que contenga 6 clases.

b) ¿Qué le dice a usted esta descripción gráfica acerca del tiempo de búsqueda que invierten
los compradores de vivienda?

3. Los siguientes datos representan las declaraciones mensuales de impuestos sobre ventas (en
miles de córdobas) que los 30 establecimientos comerciales de la ciudad A presentaron ante el
correspondiente contralor.

a) Organice los datos anteriores en una distribución de frecuencias que contenga 5


clases.
b) Grafique el histograma de frecuencias y la ojiva.
4. Precios promedios en dólares de los tres principales productos de consumo: frijol, pollo y
leche a nivel centroamericano.
Gráfica de barras que ilustra los precios promedios en dólares de los tres
principales productos de consumo: Frijol, Pollo y Leche.
Observando el gráfico anterior conteste las siguientes preguntas:

1. ¿Cuál es el menor precio del pollo a nivel centroamericano?


2. ¿Cuál es el mayor precio de la leche a nivel centroamericano?

3. ¿En qué país centroamericano la leche tiene menor precio?


4. ¿En qué país centroamericano el pollo tiene mayor precio?

5. ¿En Guatemala qué producto tiene menor precio?


6. ¿En Nicaragua qué producto tiene mayor precio?

También podría gustarte