martes, 13 de octubre de 2009

ESTADISTICAS I CAPITULO II


Organización de datos

Una organizaciòn de datos es un conjunto de datos numericos en orden creciente o decreciente.

¿Te has preguntado alguna vez para qué sirven las encuestas que a veces se hacen en la calle?, ¿Cómo saber si una estación de radio es mejor que otra? , ¿Cuál candidato puede ganar? Bueno, en realidad todo comienza con la recaudación de datos.

Los datos es información que se recoge, esto puede ser opinión de las personas sobre un tema, edad o sexo de encuestados, dónde viven, cuántas personas viven en una casa, qué tipo de sangre tiene un grupo de personas, etc. Hay tanta información que puede servirle a diferentes profesionales para sacar datos que son útiles en la toma de decisiones, para resolver problemas, o cualquier otro elemento que así lo amerite.

Te preguntarás qué hacen estas personas con la información que han recogido. Te lo explicaré: Una vez que se haya recogido toda la información, se procede a crear una base de datos, donde se registran todos los datos obtenidos. Algunas veces, si los datos son muy complicados, se codifican, esto quiere decir que se le coloca una palabra clave que identifica un título muy largo. Cuando ya está elaborada la base de datos se parece a una tabla.

Por ejemplo: para ingresar a un equipo de natación los aspirantes deben dili­genciar un formato. En el formato se debe escribir la edad y el sexo. En un día se diligenciaron 25 solicitudes y se registraron los siguientes datos.



Distribución de frecuencias es un método para organizar y resumir datos en una tabla estadística.

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y categorías y determinar las frecuencias de las clases, o sea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencias.

El caso que se describe a continuación, variables discretas se denomina distribución por conteo de valores individuales. Supongamos que un determinado colectivo, representado por la variable estadística Xi, que para mayor sencillez consideraremos como unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un suceso) X1, X2, … , Xn (supuesto que sean n los valores de la variable considerada.)

Definiremos como frecuencia de un dato el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma r valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serían N, siendo N la suma de las respectivas frecuencias de cada dato (N=ΣXi).

Este valor N será denominado como frecuencia total, mientras que la frecuencia de cada dato recibirá el nombre de frecuencia absoluta o simplemente frecuencia (fi). La frecuencia absoluta nos habla del número de veces que un dato aparece en un colectivo, más ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la importancia de este dato. Para obtener una idea de la importancia que un dato posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el concepto frecuencia relativa, que se definirá como: el coeficiente entre la frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/ΣXi).

Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor (Xl' Xz, ..., Xi' •••, xr) de forma que ninguno esta repetido.

Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas.


Llamamos total de datos o frecuencia total, y la denotaremos por N a la suma de todas las frecuencias absolutas ni•

frecuencias absolutas : es el número de veces que aparece en la muestra dicho valor de la variable y se representa por fi. En el ejemplo anterior las tablas correspondientes son:



La suma de las frecuencias absolutas debe ser el total de la muestra. En este caso, la suma de las frecuencias absolutas es 25

Frecuencia relativa: Es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fri.

Es el resultado de dividir la frecuencia absoluta entre el número de elementos de la muestra. Por ejemplo, la frecuencia relativa del valor 17 años es 9/25. La frecuencia relativa representa el tanto por uno de cada valor de la varia­ble en el total. La suma de las frecuencias relativas es igual a frecuencia porcentual.

Frecuencia porcentual: Es el resultado de multiplicar la frecuencia absolu­ta por 100 y dividirla entre el número total de valores. Por ejemplo, el porcentaje de hombres en el grupo de aspirantes al equipo de natación es (10x100)/25=40% . Así, las tablas resul­tantes son:


frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadística) en orden ascendente (fa↑) o descendente (fa↓).

Llamamos frecuencia absoluta acumulada ascendente N de un determinado valor de la variable ordenado (de menor a mayor) Xi al número de datos que son menores o iguales a el.


Llamamos frecuencia absoluta acumulada descendente N de un determinado valor ordenado Xi al número de datos que son mayores que el.

Frecuencia acumulada relativa: Es el resultado de sumar la frecuencia relativa de cierto valor con las frecuencias relativas de los datos menores. También se puede calcular mediante la división de la frecuencia acumulada absoluta entre el número total de datos.

Frecuencia acumulada porcentual: Es el resultado de sumar la frecuencia porcentual de cierto valor con las frecuencias porcentuales anteriores. Esta frecuencia indica el porcentaje de elementos del conjunto que tienen la característica con ese valor o con uno menor.

Rango estadístico o recorrido estadístico es el intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos.Es la diferencia entre el mayor valor y el menor valor de la característica en estudio.

Frecuencia es una medida que se utiliza generalmente para indicar el número de repeticiones de cualquier fenómeno o suceso periódico en la unidad de tiempo. Para calcular la frecuencia de un evento, se contabilizan un número de ocurrencias de este teniendo en cuenta un intervalo temporal, luego estas repeticiones se dividen por el tiempo transcurrido.

Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.


Límites reales de clase o límites verdaderos:
LIMITE SUPERIOR MAS LIMITE INFERIOR DIVIDO ENTRE DOS
Límite real inferior
Límite real superior

El tamaño o la amplitud de un intervalo de clase es la diferencia entre los límites superior e inferior y se le conoce como amplitud, tamaño o longitud de clase. Es igual a la diferencia entre los dos limites.

Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
La Distribución empírica de una muestra de tamaño n es la lista de las frecuencias de las modalidades que toman los datos.
Es la ley de probabilidad que carga cada uno de los valores de la muestra con la probabilidad 1/n


Gráfica Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o Símbolos, para ver la relación que esos datos guardan entre sí. También puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno.
La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores.


Existen diferentes tipos de gráficas, por ejemplo, las gráficas circulares, las gráficas de barras o columnas, y las gráficas lineales. Estas son las gráficas más comunes.
Las gráficas se pueden clasificar en:



Numéricas: con imágenes visuales que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población.
Lineales: en este tipo de gráfico se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utiliza para varias muestras en un diagrama.
De barras: se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.


Gráficas Circulares: gráficas que nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.



Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los limites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.
La representación gráfica también permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental).




Polígonos de Frecuencia Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, según el tipo de tabla de frecuencia manejada.

Características de los polígonos de frecuencias:
-No muestran frecuencias acumuladas.
-Se prefiere para el tratamiento de datos cuantitativos.
-El punto con mayor altura representa la mayor frecuencia.
-Suelen utilizarse para representar tablas tipo B.
-El área bajo la curva representa el 100% de los datos. El polígono de frecuencia esta diseñado para mantener la misma área de las columnas.



Concepto de Diagrama de Pareto
Es una herramienta que se utiliza para priorizar los problemas o las causas que los generan.
El nombre de Pareto fue dado por el Dr. Juran en honor del economista italiano VILFREDO PARETO (1848-1923) quien realizó un estudio sobre la distribución de la riqueza, en el cual descubrió que la minoría de la población poseía la mayor parte de la riqueza y la mayoría de la población poseía la menor parte de la riqueza.
El Dr. Juran aplicó este concepto a la calidad, obteniéndose lo que hoy se conoce como la regla 80/20. Según este concepto, si se tiene un problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del problema y el 80 % de las causas solo resuelven el 20 % del problema.


Se recomienda el uso del diagrama de Pareto:
Para identificar oportunidades para mejorar
Para identificar un producto o servicio para el análisis de mejora de la calidad.
Cuando existe la necesidad de llamar la atención a los problemas o causas de una forma sistemática.
Para analizar las diferentes agrupaciones de datos.
Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
Para evaluar los resultados de los cambos efectuados a un proceso comparando sucesivos diagramas obtenidos en momentos diferentes, (antes y después)
Cuando los datos puedan clasificarse en categorías.
Cuando el rango de cada categoría es importante.

Propósitos generales del diagrama de Pareto:

-Analizar las causas .
-Estudiar los resultados.
-Planear una mejora continua .



La Gráfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar visualmente en una sola revisión las minorías de características vitales a las que es importante prestar atención y de esta manera utilizar todos los recursos necesarios para llevar a cabo una acción de mejora sin malgastar esfuerzos ya que con el análisis descartamos las mayorías triviales.
Algunos ejemplos de tales minorías vitales serían:
La minoría de clientes que representen la mayoría de las ventas.
La minoría de productos, procesos, o características de la calidad causantes del grueso de desperdicio o de los costos de retrabajos.
La minoría de rechazos que representa la mayoría de quejas de los clientes.
La minoría de vendedores que esta vinculada a la mayoría de partes rechazadas.
La minoría de problemas causantes del grueso del retraso de un proceso.
La minoría de productos que representan la mayoría de las ganancias obtenidas.
La minoría de elementos que representan la mayor parte del costo de un inventario etc.





No hay comentarios:

Publicar un comentario