ESTADISTICA 1.1. Definición de estadística Es una ciencia que nos ofrece un conjunto de técnicas para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos con el objetivo de conocer un problema, proyectar su comportamiento y colaborar en la toma de decisiones sobre dicho problema. La estadística utiliza las “encuestas por muestreo” para obtener una cantidad determinada de información a un costo mínimo y óptimo de esta información para hacer inferencia con respecto a una población. Clasificación: Estadística Descriptiva: Es la que se encarga de describir una muestra obteniendo información de sus respectivas variables o características y trata de extraer conclusiones sobre el comportamiento de estas variables. La estadística descriptiva es el proceso de recolectar, agrupar y presentar datos de una manera tal que describa fácil y rápidamente dichos datos. Estadística Inferencial: Se encarga de la toma de decisiones en base a una muestra para luego inferir sus resultados para toda la población. Ejm: cuando el Ministerio de Trabajo utiliza el ingreso promedio de una muestra de varios miles de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, está utilizando una forma simple de estadística inferencial.
¿Qué parte de la estadística nos dice cuánto costará el dólar el día de mañana? ……………………………………………………………………………………………
1.2 La importancia de la estadística en la istración: Por lo general las empresas están formadas por áreas funcionales, como producción, mercadotecnia, finanzas, recursos humanos, logística, aseguramiento de la calidad, etc.
En mercadotecnia, por ejemplo, suelen determinar los requisitos y los niveles de satisfacción del cliente, el impacto de una campaña publicitaria; la precepción que tienen los clientes del producto o servicio ofrecido, mediante encuestas, entrevistas, focus group, etc. En ventas, por ejemplo se responsabilizan de dar pronósticos a los departamentos de producción y compras en donde se emplean datos históricos y proyecciones de una determinada confiabilidad. Los especialistas en compras, por ejemplo, analizan las tendencias de calidad y precios de los insumos para establecer criterios entre quienes desarrollan los productos o servicios. Además, mediante muestreo, controlan la calidad de insumos adquiridos. En finanzas, por ejemplo, se preparan presupuestos sobre la base de pronósticos que se validan periódicamente. Asimismo, se conducen proyectos en los que es importante el manejo de riesgo y valores monetarios esperados Los expertos en contabilidad, por ejemplo, se basan en métodos de auditoría y muestreo para determinar los niveles de inventario o para el control de personal. El personal de recursos humanos, mantiene datos sobre el ausentismo, rotación, tiempo extra y necesidades de capacitación, así como sobre el impacto de políticas de motivación de personal. En los departamentos de calidad, se efectúan auditorías y pruebas especiales para determinar la calidad y confiabilidad del producto o servicio. El personal de producción acostumbra a desarrollar y mantener controles de proceso de las operaciones que realiza.
1.3 Definiciones: Variable: Es una característica de la población que se va a investigar y que tiene diferentes valores. Variables cualitativas o atributos: Cuando expresan una cualidad, característica o atributo, tiene carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico. Ejm: estado civil, los colores, profesionales, grado de instrucción, etc. Las variables cualitativas pueden ser: nominales y ordinales. Nominales: Son aquellas que establecen la distinción de los elementos en diversas categorías, basándose en uno o más atributos o propiedades observadas, sin implicar algún orden entre ellas. Ejemplo: sexo, estado civil, deporte que practica, etc. Ordinales:
Se trata de variables que implican orden entre sus categorías. Ejemplo: el grado de instrucción, nivel de estudios.
Variables cuantitativas: Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir. Por ejemplo: la edad, número de hijos por familia, ingresos, etc. Las variables cuantitativas pueden ser discretas y continuas Discretas: Cuando el valor de la variable resulta de la operación de contar, su valor está presentado solo por números naturales (enteros positivos). Ejemplo: número de accidentes por día, trabajadores de una empresa, etc. Continuas: Cuando la variable es susceptible a medirse,. Las variables continuas pueden tener cualquier valor dentro de un rango o recorrido, por lo tanto se expresa por cualquier número real. Ejemplo: ingresos monetarios, producción de maíz, peso, etc.
Variables Tipo de variable Marca de computadora persona que utiliza Tiempo que usa la computadora personal por semana Número de personas de la casa que usa la computadora personal Nivel socioeconómico de una persona Número de metros cuadrados del jardín de una casa Cantidad de dinero gastado en un fin de semana Altura de una persona en centímetros UNIDAD DE ANALISIS: Es el objeto o elemento que será estudiado en una población, sobre los cuales se van a obtener datos. DATO:
Es el valor o respuesta que adquiere la variable en cada unidad de análisis. Es el resultado de la observación entrevista o recopilación en general. Los datos son la materia prima de la estadística.
POBLACION O UNIVERSO: Está referido a cualquier conjunto colectivo finito o infinito de elementos que interesan a un estudio. Es un conjunto completo de individuos, u objetos que poseen una característica común, está constituido por la totalidad de todas la unidades de análisis. MUESTRA: Es una parte o subconjunto de una población en estudio. La muestra sólo da información de la población que hemos extraído. Una nuestra debe ser representativa y adecuada. Ejemplo: La secretaría académica de una universidad está interesada en realizar un estudio sobre los motivos por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria de 200 alumnos. Defina la población y la muestra. Solución: Población: los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo Muestra: 200 alumnos que han decidido dar exámenes de recuperación ese ciclo
Población Se quiere hacer una investigación sobre el porcentaje de alumnos que fuman por lo menos un cigarrillo al día en la puerta dela universidad. El gerente de una empresa de comida rápida quiere hacer un estudio sobre el horario preferido de los clientes que almuerzan en su local; por lo que se realizó una encuesta a 100 clientes.
Muestra
PISA es un estudio internacional en educación de mayor escala del mundo y más de 60 países participan en él. Evalúa estudiantes de 15 años de edad que están cursando algún grado de secundaria en comprensión lectora, matemática y ciencia.
PARAMETRO: Es cualquier resumen de la población. Ejemplo: la edad promedio de todos los peruanos, El número de alumnos de la UPN que trabajan y estudian a la vez ESTADISTICO: Es cualquier resumen de una muestra. Ejemplo: la edad promedio de algunos peruanos elegidos al azar o el porcentaje muestral de personas que se tiñen el cabello de manera regular.
Estudiante
Nivel educativo al cual pertenece Edad en años Número de cursos aprobados Gasto familiar Tipo de sangre Ingreso familiar Color de cabello
Parámetro. Según los censos Nacionales XI de Población y VI de vivienda 2007 ejecutados por el INEI, el 50.06% se los peruanos son mujeres ¿este dato es un parámetro o estadístico? El 18 de febrero del 2010 se difundió una encuesta de la Universidad Católica, la cual registraba que el 52% de la personas entrevistadas estaba a favor de que el servicio militar fuera voluntario
EJERCICIO DE AUTOEVALUACION 1.- Indique el tipo de variables Variable Tipo de variable Número de DNI de una persona Número de metros de tela para hacer una blusa Número de teléfono celular
Estadístico
Número de pares de zapatos de una persona
2.- Defina la población, muestra, variables si se desea determinar el promedio de la edad de las mujeres peruanas que usan métodos anticonceptivos Población
Muestra
Variable
3.- Indique si son verdaderas o falsas las siguientes afirmaciones Afirmación V F El valor del parámetro se puede conocer solamente si se realiza un censo Los datos de series de tiempo se seleccionan a lo largo de varios periodos de tiempo Variables cuantitativas discretas con las variables que solo toman valores enteros Variable es el conjunto de mediciones obtenido de un elemento en particular Un estadístico se puede calcular si se realiza un censo
ORGANIZACIÓN DE DATOS En la estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de análisis y cálculos se organizan y resumen en cuadros o tablas estadísticas y gráficos. 1.1 TABLAS O CUADROS ESTADISTICOS: Partes de un Cuadro Estadístico Completo 1. Número o código de un cuadro 2. Título 3. Unidades 4. Encabezado o conceptos 5. Cuerpo o contenido del Cuadro 6. Nota de pie (no siempre es necesaria) 7. Fuente 8. Elaboración
Ejemplo:
Nº del cuadro Cuadro Nº 03 Distribución de compras de 40 nuevos clientes de la distribuidora “Regional del Norte” ,Trujillo diciembre del 2010 Soles
Intervalos [ soles > [303-353 > [353-403 > [403-453 > [453-503 > [503-553 > [553-603 > Totales
(S/.)
Titulo
Unidades
Número de clientes (fi) 8 9 6 7 4 6 n = 40
Porcentaje de clientes 20.0 22.5 15.0 17.5 10.0 15.0 100
Encabezado
Cuerpo o Contenido
Solamente se han considerado a clientes que actualmente en la ciudad deNota de pie Trujillo. Fuente: Departamento de ventas de la distribuidora. Elaboración: Jorge Ysla (Asistente del Departamento de ventas).
Fuente Elaboración
En toda tabla de distribución se utilizan los siguientes elementos: 1) CLASES O CATEGORIAS O INTERVALOS DE CLASE: n Son las diferentes clasificaciones de los datos estadísticos para su mejor identificación y análisis Ejemplo: 1ra. clase: [ 303 – 353) De 303 a menos de 353
3ra. clase: [403 – 453)
2) FRECUENCIAS ABSOLUTAS SIMPLES : fi , i = 1 , 2, 3, …, n Indica el número de veces que se repite un determinado valor o valores en cada categoría o clase Es el número de veces que se presentan (o repiten) los valores en una clase f1 =8 f3 = 6 3) FRECUENCIAS RELATIVAS SIMPLES: hI Es la proporción de la frecuencia absoluta simple y el total de frecuencias de todas las clases hi =
fi N
n N fi i1
4) FRECUENCIAS ABSOLUTAS ACUMULADAS: FI (ascendente) Es la suma sucesiva de las frecuencias absolutas simples en forma ascendente F1 = f1 F2 = f1 + f2 F3 = f1 + f2 + f3
n
Fn = f1 + f2 + f3+…+ fn =N = f i i1
5)
FRECUENCIAS RELATIVAS ACUMULADAS: HI (ascendente)
Es la suma sucesiva de las frecuencias relativas simples en forma ascendente H1 = h1 H2 = h1 + h2 H3 = h1 + h2 + h3
…
…
…
…
n
Hn = h1 + h2 + h3+…+hn =1 = hi i1
Además es la proporción de la frecuencia absoluta y el número total de datos (suma de frecuencias absolutas simples)
f f 2 f 1 f 2 F2 N N N N
Por ejemplo: H2 = h1 + h2= 1
Generalizando: Hi
Fi N
Para cualquier Hi:
i
Hi = =
hj
j1
6) LIMITES DE CLASE:
LIi , LSi Son los valores menores y mayores de un intervalo 2da. clase [ 353 - 403)
LI2 = 353
LS2 = 403
LI4 = 453
LS4 = 503
7) MARCA DE CLASE: Xi Es el punto medio de una clase. Se calcula como la semisuma de los límites inferior y superior de una misma clase
Xi
X1
303 353 328 2
LIi LSi 2 X2
353 403 2
378
8) TAMAÑO DE CLASE: C Se determina de la siguiente manera:
a) Diferencia entre 2 límites consecutivos (inferiores o superiores)
C = LSi+1 - LSi C = L Ii+1 - LIi b) Diferencia entre 2 marcas de clase consecutivas
C = Xi+1 – Xi
C = Xi – Xi-1
c) Diferencia entre límites superior e inferior
C = LSi - LIi
Cuadro Nº 03 Distribución de compras de 40 nuevos clientes de la distribuidora “Regional del Norte” ,Trujillo diciembre del 2010 Soles
Intervalos [ soles >
[303-353 > [353-403 > [403-453 > [453-503 > [503-553 > [553-603 > Totales Ejercicio:
Número de clientes (fi) 8 9 6 7 4 6 n = 40
Número de clientes (Fi)
(S/.)
Porcentaje de clientes (hi%)
Porcentaje acumulado (Hi %)
Marca de clase (xi)
Basándose en la información presentada en el cuadro anterior, determine e interprete: f3, F4, h2%, H3 %, x4
f3
nuevos clientes realizaron una compra por un monto de [ 403 – 453> soles
=
F4
=
nuevos clientes realizaron una compra por un monto de [ 303 – 503> soles
h2% = el , H3% = el
x4 =
de comerciantes realizaron una compra por un monto de [ 353 – 403> soles de comerciantes realizaron una compra por un monto de [ 403 – 453> soles nuevos clientes realizaron una compra promedio por un monto de 478 soles
CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS Existen diferentes métodos: 1.- Método de Spiegel 2.- Método de Sturges 3.- Método de tallos y hojas
APLICACIONES
Formar grupos de trabajo y analizar los siguientes casos que se presentan en esta práctica. Luego identifique, la población, una posible muestra, la unidad de estudio, variable de estudio y el tipo de variable. CASO Nº 01: Un investigador de mercado quiere saber cuál es la marca de aceite que más se utiliza o más prefieran las amas de casa de la ciudad de Cajamarca. Para llevar a cabo esta investigación selecciona una muestra de 504 amas de casa que fueron seleccionadas según zona o urbanización de la ciudad de Cajamarca. Población Muestra Unidad de estudio Variable de estudio
Todas las amas de casa de la ciudad de Cajamarca 504 amas de casa de la ciudad de Cajamarca Cada una de las amas de casa Preferencia por marca de aceite de las amas de casa
Tipo de Variable
Cualitativa nominal
CASO Nº 02: El Ingeniero de Producción de vino “Borgoña”, dentro de su evaluación diaria, desea saber si el grado de azúcar, porcentaje de alcohol, tiempo de maceración, etc., han cumplido con los parámetros de calidad en la producción del último mes. Población Muestra Unidad de estudio Variable de estudio Tipo de Variable CASO Nº 03 Varias veces durante un día el ingeniero de control de calidad, de una fábrica textil, selecciona diferentes muestras de metros cuadrados de telas, la examina y registra el número de imperfecciones que encuentra. Población Muestra Unidad de estudio Variable de estudio Tipo de Variable CASO Nº 04: Un nuevo tratamiento biológico para controlar el gusano de la manzana es probado en 20 huertos comerciales localizados en cierta provincia. Diez de estos huertos serán tratados y comparados con 10 bajo control, pero cuyo tratamiento fue suspendido. Podría usarse una medición normal para determinar el grado de infestación (%) del gusano de la manzana en cada grupo. Población Muestra Unidad de estudio Variable de estudio Tipo de Variable
I. Después de revisar la teoría siguientes preguntas:
estadística brindada por el profesor, resuelva las
Un objetivo general de la Estadística es estimar los parámetros de la población, usando muestra estadísticas. a) Verdadero b) Falso Coloca en el paréntesis la letra correspondiente a la respectiva definición: A. Método de recolección de datos que incluye en el estudio a todos los elementos de una población. B. Característica que manifiesta cambios en valor. C. Conjunto de datos que se recolectan en una investigación. D. Recolección de información mediante cuestionarios en una muestra de una población.
MUESTRA ( ) CENSO ( ) VARIABLE ( ) ENCUESTA ( ) POR MUESTREO
Por población o universo se entiende: a) Un recuento de unidades. b) Un conjunto de seres humanos. c) El recuento de todas las unidades que tiene una característica en común. d) Ninguna de las anteriores. Un parámetro es una medida obtenida con los datos de la muestra, mientras que un estimador es una medida obtenida con los datos de la población. a)Verdadero b) Falso Justifique su respuesta
Se debe responder verdadero si el enunciado es siempre válido. En caso contrario se deberá sustituir la palabra subrayada por otra, con la cual el enunciado tenga validez: a) Una población infinita tiene un número ilimitado de elementos. b) El conteo de los empleados de una empresa de acuerdo a su cargo, es un ejemplo de características cuantitativas. c) La Estadística Descriptiva es el estudio de una muestra a fin de hacer estimaciones acerca de la población de la cual se tomó la muestra. d) Estimador es la medida estadística obtenida con los datos de la población. II. Responda los siguientes ejercicios: EJERCICIO 1: Se realizó una encuesta para determinar las preferencias de los estudiantes con respecto a las autoridades estudiantiles. Con este fin se entrevistaron 1500 estudiantes y 600 de ellos están a favor del candidato Flores. a) ¿Cómo está formada la muestra? b) ¿Cómo está formada la población?
c) ¿La población es finita o infinita? d) ¿Cuál es el valor estadístico de la proporción de estudiantes que está a favor del candidato Flores? EJERCICIO 2: Se realizó un muestreo de opinión para determinar si los profesores de Lima prefieren textos de un autor X con respecto a otro. Con este fin se entrevistaron a 2000 profesores y entre ellos 1500 prefieren al autor X. Responda lo siguiente: a) ¿Cómo está formada la muestra? b) ¿Cómo está formada la población? c) ¿La población es finita o infinita? d) ¿Cuál es el valor estadístico de la proporción de profesores que prefieren textos del autor X? EJERCICIO 3: En cierta comunidad, se desea precisar la cantidad de estudiantes de educación primaria que tienen problemas de aprendizaje. Se seleccionó a 80 jóvenes y 20 de ellos presentaron problemas de aprendizaje. Identifique: a) ¿Cómo está formada la población? b) ¿Cómo está formada la muestra? c) ¿La población es finita o infinita? d) ¿Cuál es el valor estadístico de la proporción de estudiante de educación primaria que tienen problemas de aprendizaje? EJERCICIO 4: Se realizó una encuesta telefónica a 200 familias del distrito de Lince con la finalidad de averiguar el número promedio de ciudadanos que están de acuerdo en pagar mayores impuestos para mejorar la calidad de la educación pública. La encuesta reveló que un 46% de ciudadanos sí están dispuestos a pagar mayores impuestos para lograr tal fin. ¿46% es un valor estadístico o un parámetro? EJERCICIO 5: Identifique las unidades elementales de estudio y mencione dos ejemplos de observaciones en cada uno de los siguientes casos: a) Una enfermera investiga el control y crecimiento del niño sano en un determinado colegio. b) Un investigador estudia el crecimiento de los precios de los productos de primera necesidad en el distrito de Villa El Salvador.
EJERCICIO 6: En un colegio se desea aplicar una nueva técnica de enseñanza, motivo por el cual se realizó una encuesta, obteniéndose los siguientes resultados: el 20% indicó que no era necesario, el 60% que si era necesario y al resto le resultaba indiferente. Según el enunciado colocar Verdadero (V) o Falso (F) según corresponda. (
)
( ( (
) ) )
La variable en estudio es el porcentaje de preferencia de una nueva técnica de enseñanza. La variable en estudio es del tipo cuantitativo discreto. La población es finita. La muestra está formada por 100 alumnos.
EJERCICIO 7: Un censo completo del plantel de estudiantes de un colegio de educación inicial reveló que el número de estudiantes de 4 años a más era de 210 ¿Este número 210 es un estadígrafo o un parámetro? ¿Por qué? EJERCICIO 8: En un muestreo de opinión entre los alumnos de primaria del colegio Inmaculada, para averiguar su preferencia por la galleta A con respecto a otra, se entrevistaron a 450 alumnos y se encontró que 220 prefieren la galleta A. indique la alternativa correcta. a) La población es infinita. b) La muestra está formada por los 220 alumnos. c) La población está formada por los 450 alumnos. d) La muestra está formada por los 450 alumnos. e) La población la constituyen todos los alumnos, los profesores y otros trabajadores del Colegio.
III. A continuación, determine 3 variables que se puedan investigar en cada una de las siguientes unidades de análisis e indique el tipo de variable al que corresponde: UNIDAD DE ANALISIS: CLUB DE FUTBOL ALIANZA LIMA VARIABLE TIPO DE VARIABLE
UNIDAD DE ANALISIS: TIENDA SAGA FALABELLA VARIABLE TIPO VARIABLE
DE
IV. Elabore un instrumento de recolección de datos: Sugerencia: Elaborar un encuesta con diez preguntas utilizando en por lo menos dos preguntas las escalas de Likert. (Trabajo de investigación). CUADROS DE DISTRIBUCION DE FRECUENCIAS: 1.- Se tomó una muestra de personas y se les preguntó por la marca de cereza más consumida en los últimos tres meses. Los resultados se muestran en la siguiente tabla. Construya la distribución de frecuencias cuzqueña cristal cristal brahma cristal cristal cristal cusqueña
cristal cristal cristal cristal cristal cristal cristal cristal
cristal cuzqueña cristal cristal brahma cristal cristal cristal
cristal cristal cristal cristal cristal cristal cuzqueña cristal cristal cristal pilsen cristal cristal cristal cristal brahma cristal cuzqueña cristal cristal brahma cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal cristal otros cristal pilsen cristal
2.- Se realiza una investigación a los vendedores de la cadena nacional de tiendas “ELEKTRA” para determinar el promedio de sus ingresos diarios (en soles). Se selecciona una muestra de 50 vendedores y se obtienen sus ingresos durante el 1 de diciembre del 2010. 53
63
69
74
77
79
82
85
88
92
57
64
70
74
77
79
82
85
90
93
58
64
71
74
78
81
83
86
90
94
61
67
72
74
78
81
83
87
90
97
61
68
73
74
79
81
84
87
90
97
a) Construya un cuadro de distribución de frecuencias con todas sus partes, sugeridos en clase, presentándolos luego en forma completa. b) ¿Cuántos vendedores tienen un ingreso diario entre S/. 67 y S/. 80 N.S. inclusive? c) ¿Qué porcentaje de vendedores tienen un ingreso diario entre S/. 74 y S/. 80 N.S. inclusive? d) ¿Cuántos vendedores tienen un ingreso diario menor a S/. 74 N.S.?
1. Se realizó una encuesta a 25 clubes de fútbol, sobre el número de futbolistas extranjeros por equipo. Los resultados en el orden obtenido fueron: 3–0–4–1–3–2–2–5–0–4–3–1–3 3–3–5–1- -2–3–4–4–2–3–0 Presente esta información en una tabla e indique a partir de ella: a) ¿Cuántos clubes tiene por lo menos 2 jugadores extranjeros? b) ¿Cuántos clubes tienen a lo sumo 4 jugadores extranjeros? c) ¿Cuántos clubes tienen 3 jugadores extranjeros o más, pero menos de 5? 2. A continuación se presenta una base datos respecto al tipo de religión practicada por 28 trabajadores de la empresa “Mochik Cola”, en una encuesta practicada por la empresa con fines de realizar un programa de capacitación. ateo protestante ateo ateo protestante catolico catolico
protestante catolico ateo ateo catolico catolico ateo
católico católico ateo catolico ateo catolico protestante
ateo protestante ateo catolico catolico ateo catolico
3. A continuación se presentan los montos correspondientes a los gastos semanales en soles de 40 familias de Ica, en febrero del 2010. 570
445
320
460
540
379
420
570
448 537 310 570
470 530 320 395
315 380 415 560
365 540 590 330
470 305 490 360
390 475 580 530
430 598 355 405
303 382 475 485