lunes, 11 de febrero de 2013


1.2.4 Medidas de asimetría y curtosis.
El objetivo de la medida de la asimetría es, sin necesidad de dibujar la distribución de frecuencias, estudiar la deformación horizontal de los valores de la variable respecto al valor central de la media. Las medidas de forma pretenden estudiar la concentración de la variable hacia uno de sus extremos.

Asimétrica a la izquierda
La curva de la gráfica encuentra su punto más alto en la parte izquierda

Asimétrica a la derecha.
La curva de la gráfica encuentra su punto más alto en la parte derecha

Curtosis
Mesocurtosis, si la distribución de los datos es normal y el coeficiente de curtosis es cero.
Leptocurtosis, si está más apuntado que lo normal y el coeficiente de curtosis es positivo
Platicurtosis, si esta menos apuntado y el coeficiente es negativo.


1.3.1 Diagramas de dispersión
Cuando entre dos variables existe una relación única entre ellas, se interesa investigar el grado de correlación entre ellas.

La forma de construir un diagrama de dispersión es tomando dos puntos relacionados entre sí y acomodándolos en un plano cartesiano y viendo la tendencia que sigue (se necesita por lo menos 40 pares de datos para hacer un diagrama exacto).


1.3.2 Diagrama de tallo y hoja
Los valores de los datos se utilizan para efectuar tal ordenación. El tallo se forma con el (los) primer(os) dígito(s) del dato, mientras que la hoja se forma con los demás dígitos siguientes. Por ejemplo, el valor numérico 458 se dividiría en 45-8


1.3.3 Histogramas
El trabajo de control de calidad requiere tomar datos, organizarlos y analizarlos. Una de las formas más útiles para organizarlos y hacer su análisis es presentarlos en histogramas. Excel provee recursos para hacer histogramas con colecciones desorganizadas de datos. Lo primero que necesitamos es tener los datos en una hoja de Excel, por lo general en la columna A.  A veces es necesario que los datos se mantengan en el orden en el que fueron colectados, es decir, como aparecen en la columna A. Excel puede ordenarlos de menor a mayor o viceversa. De ser necesario ordenarlos de cualquier forma, y si también deseamos conservarlos en su orden original, los copiamos de la columna A y los pasamos a la B. Una vez los tengamos en B, los seleccionamos y pulsamos el botón .sort ascending  en el  toolbar. Como resultado se ordenan los datos de menor a mayor. En esta forma notamos que en la celda B1 se encuentra el número más pequeño de la colección, mientras que el más grande está al final, en la última celda ocupada de la columna B. Es posible que los datos sean tan numerosos como 65,536, que es el máximo que puede manejar una sola hoja de Excel, por lo que llegar al final de ellos con el ratón puede consumir mucho tiempo. Existe una forma rápida de hacerlo oprimiendo simultáneamente las teclas .Ctrl+End. Asimismo, podemos regresar a B1 oprimiendo .Ctrl+Home. Es necesario que anotemos el número de la última celda de datos en la columna B porque las operaciones que vamos a describir en seguida así lo requieren


1.3.4 Ojivas
Una distribución de frecuencia acumulativa nos permite ver cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los números de elementos dentro de los intervalos. Por ejemplo, si queremos saber cuántos galones contienen menos de 17.0 ppm, podemos servirnos de una tabla que incluya frecuencias acumulativas “menores que” en nuestra muestra.
Se llama ojiva a la gráfica de una distribución de frecuencia acumulativa. Los puntos graficados representan la cantidad de galones que tienen menos cloro que las partes por millón indicadas sobre el eje horizontal.
En ocasiones la información que se utiliza se presenta a partir de frecuencias “mayores que”. La ojiva apropiada para tal información tendrá una pendiente hacia abajo y hacia la derecha.
También es posible construir una ojiva de una distribución de frecuencia relativa, de la misma manera que una absoluta.


1.3.5 Polígono de Frecuencia
Polígono de frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.
Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se forma a partir de la unión de los distintos puntos medios de las cimas de las columnas que configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son unas y otras.
En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para llevar a cabo lo que es la comparación de los resultados de un proceso determinado.

Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las distintas columnas del histograma. En el momento de la representación de todas las frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente.
Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal), deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), en cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El polígono de frecuencia se creará al unir, mediante un segmento, las diversas temperaturas más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta en el mismo dibujo.
El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia, mientras que el área que se sitúa debajo de la curva incluye todos los datos que existen. Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número de veces que un acontecimiento periódico se reitera en una unidad temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar que estos se pueden confeccionar de una manera muy sencilla y rápida. En concreto, se da la oportunidad de acometerlos mediante un programa informático que se ha convertido en uno de los ejes claves del funcionamiento de cualquier empresa. Nos estamos refiriendo al software conocido como Excel.
Este es un programa, de Microsoft Office, que se confeccionó con el claro objetivo de que sus usuarios pudieran trabajar con lo que son hojas de cálculo. Por tal motivo, es lógico que también permita la posibilidad de crear polígonos de frecuencia a la hora de comparar cifras y tomar decisiones en base a las mismas.
En concreto, para conseguir crear los mismos con Excel se tiene que partir de la existencia de una serie de gráficos que se hayan confeccionado previamente para seguidamente desarrollar un conjunto de acciones que den lugar a aquellos.


Diagrama de cajas y de cejas
Un diagrama de caja, también llamado diagrama de caja y bigotes, está formado por un rectángulo, la caja, y dos segmentos, los bigotes, uno a cada lado del rectángulo. La caja abarca el recorrido intercuartílico, que es el intervalo comprendido entre el primer cuartil q1 y el tercer cuartil q3. Dentro dela caja se representa con un segmento la mediana de la distribución.

 El bigote izquierdo queda determinado por el valor mínimo y el primer cuartil y el derecho por el tercer cual se consideran valores atípicos los menores que q1-1.5· (q3-q1) y los mayores que q3+ 1.5· (q3-q1). Esto quiere decir que la longitud máxima de los bigotes es una vez y media la longitud de la caja (q3-q1). Cuando hay valores atípicos éstos se representan fuera del diagrama de caja, mediante asteriscos o puntos. Los diagramas de caja permiten una fácil lectura e interpretación del tipo de simetría de una distribución:
 Es simétrica cuando la media, mediana y moda de la distribución coinciden y los datos se distribuyen de igual forma a ambos lados de esas medidas.
Es asimétrica positiva o sesgada a la derecha, cuando los datos tienden a concentrarse hacia la parte inferior de la distribución. La media se situaría a la derecha de la mediana.
Es asimétrica negativa o sesgada hacia la izquierda cuando los datos tienden a concentrarse hacia la parte superior de la distribución. La media se situaría a la izquierda de la mediana. Útil y el valor máximo, excepto si existen valores atípicos.


Diagrama de sectores.
Se toma un círculo y se divide en tantos sectores como clases tengamos, siendo el arco del círculo proporcional a las frecuencias absolutas (también lo podemos hacer con las frecuencias relativas o porcentajes)
Para determinar el arco circular que corresponde a cada clase relacionamos el total de observaciones con los 360º grados de la circunferencia. Gráfica de sectores es configurable, disponemos de varios argumentos, en la función hist (), para tal fin:
X: Vector de cantidades positivas, los cuales son presentados como las áreas en el gráfico.
labels: Un vector de caracteres “strings” que dan nombres a las áreas.
edges: Aproxima la linea exterior circular mediante un polígono con el número de lados especificado, que por defecto es 200.
clockwise: Argumento lógico, TRUE o FALSE, que indica si la representación es en sentido anti horario (es decir, matemáticamente sentido positivo) o no, el sentido antihorario es la opción por defecto (FALSE).
init.angle: Especifica el ángulo inicial el cual se representará el diagrama (en grados). El valor por defecto es 0 (es decir, a las 3 en punto) a menos que el argumento clockwise esté configurado como TRUE entonces, init.angle será por defecto 90 (grados), (es decir, 12 en punto).
density: Dibuja porciones ralladas por pulgada. El valor predeterminado es NULL, significa que no se dibujan líneas de rallado.
angle: Pendiente de las líneas de rallado, dado como un ángulo en grados (a la izquierda).
radius: La torta es dibujada centrada en una caja cuadrada cuyos lados se mueven de -1 a 1. Si se usan etiquetas largas puede ser necesario usar radios más pequeños.
col: Un vector de colores, para rellenar los sectores del gráfico.
main: Para dar título al gráfico.

No hay comentarios:

Publicar un comentario