Organización de datos
¿Te has preguntado alguna vez para qué sirven las encuestas que a veces se hacen en la calle?, ¿Cómo saber si una estación de radio es mejor que otra? , ¿Cuál candidato puede ganar? Bueno, en realidad todo comienza con la recaudación de datos.
Distribución de frecuencias es un método para organizar y resumir datos en una tabla estadística.
El caso que se describe a continuación, variables discretas se denomina distribución por conteo de valores individuales. Supongamos que un determinado colectivo, representado por la variable estadística Xi, que para mayor sencillez consideraremos como unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un suceso) X1, X2, … , Xn (supuesto que sean n los valores de la variable considerada.)
Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma r valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serían N, siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi).
Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:
Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor (Xl' Xz, ..., Xi' •••, xr) de forma que ninguno esta repetido.
Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas.
Llamamos total de datos o frecuencia total, y la denotaremos por N a la suma de todas las frecuencias absolutas ni•
frecuencias absolutas : es el número de veces que aparece en la muestra dicho valor de la variable y se representa por fi. En el ejemplo anterior las tablas correspondientes son:
La suma de las frecuencias absolutas debe ser el total de la muestra. En este caso, la suma de las frecuencias absolutas es 25
Frecuencia relativa: Es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri.
Es el resultado de dividir la frecuencia absoluta entre el número de elementos de la muestra. Por ejemplo, la frecuencia relativa del valor 17 años es 9/25. La frecuencia relativa representa el tanto por uno de cada valor de la variable en el total. La suma de las frecuencias relativas es igual a frecuencia porcentual.
Frecuencia porcentual: Es el resultado de multiplicar la frecuencia absoluta por 100 y dividirla entre el número total de valores. Por ejemplo, el porcentaje de hombres en el grupo de aspirantes al equipo de natación es (10x100)/25=40% . Así, las tablas resultantes son:
frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓).
Llamamos frecuencia absoluta acumulada ascendente N de un determinado valor de la variable ordenado (de menor a mayor) Xi al número de datos que son menores o iguales a el.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
LIMITE SUPERIOR MAS LIMITE INFERIOR DIVIDO ENTRE DOS
Límite real inferior
Límite real superior
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Es la ley de probabilidad que carga cada uno de los valores de la muestra con la probabilidad 1/n
La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores.
Las gráficas se pueden clasificar en:
Lineales: en este tipo de gráfico se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utiliza para varias muestras en un diagrama.
De barras: se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.
La representación gráfica también permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental).
Polígonos de Frecuencia Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, según el tipo de tabla de frecuencia manejada.
-No muestran frecuencias acumuladas.
-Se prefiere para el tratamiento de datos cuantitativos.
-El punto con mayor altura representa la mayor frecuencia.
-Suelen utilizarse para representar tablas tipo B.
-El área bajo la curva representa el 100% de los datos. El polígono de frecuencia esta diseñado para mantener la misma área de las columnas.
Es una herramienta que se utiliza para priorizar los problemas o las causas que los generan.
El nombre de Pareto fue dado por el Dr. Juran en honor del economista italiano VILFREDO PARETO (1848-1923) quien realizó un estudio sobre la distribución de la riqueza, en el cual descubrió que la minoría de la población poseía la mayor parte de la riqueza y la mayoría de la población poseía la menor parte de la riqueza.
El Dr. Juran aplicó este concepto a la calidad, obteniéndose lo que hoy se conoce como la regla 80/20. Según este concepto, si se tiene un problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del problema y el 80 % de las causas solo resuelven el 20 % del problema.
Para identificar oportunidades para mejorar
Para identificar un producto o servicio para el análisis de mejora de la calidad.
Cuando existe la necesidad de llamar la atención a los problemas o causas de una forma sistemática.
Para analizar las diferentes agrupaciones de datos.
Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
Para evaluar los resultados de los cambos efectuados a un proceso comparando sucesivos diagramas obtenidos en momentos diferentes, (antes y después)
Cuando los datos puedan clasificarse en categorías.
Cuando el rango de cada categoría es importante.
-Estudiar los resultados.
-Planear una mejora continua .
La Gráfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar visualmente en una sola revisión las minorías de características vitales a las que es importante prestar atención y de esta manera utilizar todos los recursos necesarios para llevar a cabo una acción de mejora sin malgastar esfuerzos ya que con el análisis descartamos las mayorías triviales.
Algunos ejemplos de tales minorías vitales serían:
La minoría de clientes que representen la mayoría de las ventas.
La minoría de productos, procesos, o características de la calidad causantes del grueso de desperdicio o de los costos de retrabajos.
La minoría de rechazos que representa la mayoría de quejas de los clientes.
La minoría de vendedores que esta vinculada a la mayoría de partes rechazadas.
La minoría de problemas causantes del grueso del retraso de un proceso.
La minoría de productos que representan la mayoría de las ganancias obtenidas.
La minoría de elementos que representan la mayor parte del costo de un inventario etc.