1.2.4 Medidas de asimetría y curtosis.
El objetivo de la
medida de la asimetría es, sin necesidad de dibujar la distribución de
frecuencias, estudiar la deformación horizontal de los valores de la variable
respecto al valor central de la media. Las medidas de forma pretenden estudiar
la concentración de la variable hacia uno de sus extremos.
Asimétrica
a la izquierda
La curva de la
gráfica encuentra su punto más alto en la parte izquierda
Asimétrica
a la derecha.
La curva de la
gráfica encuentra su punto más alto en la parte derecha
Curtosis
Mesocurtosis, si la
distribución de los datos es normal y el coeficiente de curtosis es cero.
Leptocurtosis, si
está más apuntado que lo normal y el coeficiente de curtosis es positivo
Platicurtosis, si
esta menos apuntado y el coeficiente es negativo.
1.3.1 Diagramas de dispersión
Cuando entre dos variables existe una relación única entre ellas, se
interesa investigar el grado de correlación entre ellas.
La forma de construir un diagrama de dispersión es tomando dos puntos
relacionados entre sí y acomodándolos en un plano cartesiano y viendo la
tendencia que sigue (se necesita por lo menos 40 pares de datos para hacer un
diagrama exacto).
1.3.2
Diagrama de tallo y hoja
Los valores de los
datos se utilizan para efectuar tal ordenación. El tallo se forma con el (los)
primer(os) dígito(s) del dato, mientras que la hoja se forma con los demás
dígitos siguientes. Por ejemplo, el valor numérico 458 se dividiría en 45-8
1.3.3 Histogramas
El trabajo de
control de calidad requiere tomar datos, organizarlos y analizarlos. Una de las
formas más útiles para organizarlos y hacer su análisis es presentarlos en
histogramas. Excel provee recursos para hacer histogramas con colecciones
desorganizadas de datos. Lo primero que necesitamos es tener los datos en una
hoja de Excel, por lo general en la columna A.
A veces es necesario que los datos se mantengan en el orden en el que
fueron colectados, es decir, como aparecen en la columna A. Excel puede ordenarlos
de menor a mayor o viceversa. De ser necesario ordenarlos de cualquier forma, y
si también deseamos conservarlos en su orden original, los copiamos de la
columna A y los pasamos a la B. Una vez los tengamos en B, los seleccionamos y
pulsamos el botón .sort ascending en
el toolbar. Como resultado se ordenan
los datos de menor a mayor. En esta forma notamos que en la celda B1 se
encuentra el número más pequeño de la colección, mientras que el más grande
está al final, en la última celda ocupada de la columna B. Es posible que los
datos sean tan numerosos como 65,536, que es el máximo que puede manejar una
sola hoja de Excel, por lo que llegar al final de ellos con el ratón puede
consumir mucho tiempo. Existe una forma rápida de hacerlo oprimiendo simultáneamente
las teclas .Ctrl+End. Asimismo, podemos regresar a B1 oprimiendo .Ctrl+Home. Es
necesario que anotemos el número de la última celda de datos en la columna B
porque las operaciones que vamos a describir en seguida así lo requieren
1.3.4 Ojivas
Una distribución de frecuencia acumulativa nos permite ver
cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en
lugar de limitarnos a anotar los números de elementos dentro de los intervalos.
Por ejemplo, si queremos saber cuántos galones contienen menos de 17.0 ppm,
podemos servirnos de una tabla que incluya frecuencias acumulativas “menores
que” en nuestra muestra.
Se llama ojiva a la gráfica de una distribución de frecuencia
acumulativa. Los puntos graficados representan la cantidad de galones que
tienen menos cloro que las partes por millón indicadas sobre el eje horizontal.
En ocasiones la información que se utiliza se presenta a partir
de frecuencias “mayores que”. La ojiva apropiada para tal información tendrá
una pendiente hacia abajo y hacia la derecha.
También es posible construir una ojiva de una distribución de
frecuencia relativa, de la misma manera que una absoluta.
1.3.5 Polígono de Frecuencia
Polígono de frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Estos
histogramas emplean columnas verticales para reflejar frecuencias): el polígono de frecuencia es
realizado uniendo los puntos de mayor altura de estas columnas.
Es decir, por tanto, podríamos establecer que un polígono de frecuencia
es aquel que se forma a partir de la unión de los distintos puntos medios de
las cimas de las columnas que configuran lo que es un histograma de frecuencia.
Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical
y porque nunca debe haber espacios entre lo que son unas y otras.
En las ciencias sociales, en las ciencias naturales y también en las
económicas es donde con más frecuencia se hace uso de estos mencionados
histogramas ya que se emplean para llevar a cabo lo que es la comparación de
los resultados de un proceso determinado.
Se conoce como polígonos de
frecuencia para datos agrupados a aquellos que se desarrollan
mediante la marca de clase que tiene coincidencia con el punto medio de las
distintas columnas del histograma. En el momento de la representación de todas
las frecuencias que forman parte de una tabla de datos agrupados, se genera el
histograma de frecuencias
acumuladas que posibilita la diagramación del polígono
correspondiente.
Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas promedio de
una ciudad en un determinado periodo temporal. En el eje X (horizontal), deben
indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), en cambio, se
registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El
polígono de frecuencia se creará al unir, mediante un segmento, las diversas temperaturas más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar
varias distribuciones distintas o la clasificación cruzada de una variable
cuantitativa continua con una cualitativa o cuantitativa discreta en el mismo
dibujo.
El punto de más altura de un polígono de frecuencia equivale a la mayor
frecuencia, mientras que el área que se sitúa debajo de la curva incluye todos
los datos que existen. Cabe recordar que la frecuencia es la repetición mayor o menor de un evento,
o el número de veces que un acontecimiento periódico se reitera en una unidad
temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que
resaltar que estos se pueden confeccionar de una manera muy sencilla y rápida.
En concreto, se da la oportunidad de acometerlos mediante un programa
informático que se ha convertido en uno de los ejes claves del funcionamiento
de cualquier empresa. Nos estamos refiriendo al software conocido como Excel.
Este es un programa, de Microsoft Office, que se confeccionó con el
claro objetivo de que sus usuarios pudieran trabajar con lo que son hojas de
cálculo. Por tal motivo, es lógico que también permita la posibilidad de crear
polígonos de frecuencia a la hora de comparar cifras y tomar decisiones en base
a las mismas.
En concreto, para conseguir crear los mismos con Excel se tiene que
partir de la existencia de una serie de gráficos que se hayan confeccionado
previamente para seguidamente desarrollar un conjunto de acciones que den lugar
a aquellos.
Diagrama de cajas y de cejas
Un diagrama de caja,
también llamado diagrama de caja y bigotes, está formado por un rectángulo, la
caja, y dos segmentos, los bigotes, uno a cada lado del rectángulo. La caja
abarca el recorrido intercuartílico, que es el intervalo comprendido entre el
primer cuartil q1 y el tercer cuartil q3. Dentro dela caja se representa con un
segmento la mediana de la distribución.
El bigote izquierdo queda determinado por el
valor mínimo y el primer cuartil y el derecho por el tercer cual se consideran
valores atípicos los menores que q1-1.5· (q3-q1) y los mayores que q3+ 1.5·
(q3-q1). Esto quiere decir que la longitud máxima de los bigotes es una vez y
media la longitud de la caja (q3-q1). Cuando hay valores atípicos éstos se
representan fuera del diagrama de caja, mediante asteriscos o puntos. Los
diagramas de caja permiten una fácil lectura e interpretación del tipo de
simetría de una distribución:
Es simétrica cuando la media, mediana y moda
de la distribución coinciden y los datos se distribuyen de igual forma a ambos
lados de esas medidas.
Es asimétrica positiva
o sesgada a la derecha, cuando los datos tienden a concentrarse hacia la parte
inferior de la distribución. La media se situaría a la derecha de la mediana.
Es asimétrica negativa
o sesgada hacia la izquierda cuando los datos tienden a concentrarse hacia la
parte superior de la distribución. La media se situaría a la izquierda de la
mediana. Útil y el valor máximo, excepto si existen valores atípicos.
Diagrama de sectores.
Se toma un círculo y
se divide en tantos sectores como clases tengamos, siendo el arco del círculo
proporcional a las frecuencias absolutas (también lo podemos hacer con las
frecuencias relativas o porcentajes)
Para determinar el arco
circular que corresponde a cada clase relacionamos el total de observaciones
con los 360º grados de la circunferencia. Gráfica de sectores es configurable,
disponemos de varios argumentos, en la función hist (), para tal fin:
X:
Vector de cantidades positivas, los cuales son presentados como las áreas en el
gráfico.
labels: Un vector de caracteres “strings” que dan nombres a las áreas.
edges: Aproxima la linea exterior circular mediante un polígono con el número
de lados especificado, que por defecto es 200.
clockwise: Argumento lógico, TRUE o FALSE, que indica si la
representación es en sentido anti horario (es decir, matemáticamente sentido
positivo) o no, el sentido antihorario es la opción por defecto (FALSE).
init.angle: Especifica el ángulo inicial el cual se representará el
diagrama (en grados). El valor por defecto es 0 (es decir, a las 3 en punto) a
menos que el argumento clockwise esté configurado como TRUE entonces,
init.angle será por defecto 90 (grados), (es decir, 12 en punto).
density: Dibuja porciones ralladas por pulgada. El valor predeterminado es NULL,
significa que no se dibujan líneas de rallado.
angle: Pendiente de las líneas de rallado, dado como un ángulo en grados (a la
izquierda).
radius: La torta es dibujada centrada en una caja cuadrada cuyos lados se mueven
de -1 a 1. Si se usan etiquetas largas puede ser necesario usar radios más
pequeños.
col: Un vector de colores, para rellenar los sectores del gráfico.
main: Para dar título al gráfico.
No hay comentarios:
Publicar un comentario