Las gráficas de Cajas y Bigotes, son muy utilizadas para comparar distribuciones de los datos de dos o más grupos.
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un valor extremo, u outliers.
Por
lo general, en esta gráfica emplea como medidas los valores mínimo y máximo y
los cuartiles, los cuales son representados por una caja rectangular,
donde los lados más largos muestran el recorrido intercuartílico.
Este rectángulo está dividido por un segmento vertical (o un punto) que indica donde se
posiciona la mediana y por lo tanto su relación con el primer y tercer cuartil. El rango intercuartículo, se puede calcular como la diferencia entre el valor del tercer cuartil y el valor del primer cuartil. RI = Q3 - Q1
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un valor extremo, u outliers.
Este
gráfico se puede representar en forma vertical, u horizontal, la información
que presenta es la misma.
Una distribución simétrica dará idea de una distribución de datos normal. Por el contrario, si uno de los bigotes es más largo que otro, sugerirá sesgo en la distribución hacia el lado más largo.
El siguiente diagrama de
cajas y bigotes muestra de forma comparativa la distribución de las edades de
hombres y mujeres.
En esta gráfica comparativa de la edad de hombres y mujeres, se observa que la edad mínima en ambos grupos es la misma, es decir, 18 años. No así la edad máxima. Pues el grupo de las mujeres presenta una edad máxima de 29 años y el de hombres de 28 años de edad.
Los cuartiles 1 y 3, y la mediana de ambos grupos, son diferentes también. En el grupo de las mujeres el primer cuartil y la mediana coinciden con el valor mínimo (por eso no hay bigote inferior). Esto quiere decir que el 50% de las chicas tienen 18 años de edad y el otro 50%, más de 18 años.
En el grupo de los hombres, el primer cuartil es de 19 años y la mediana de 20 años de edad. Esto quiere decir, que el 25% de los hombres tienen hasta 19 años de edad, y otro 25% tienen 20 años. El 50% restante supera los 20 años de edad (es el lado opuesto y más largo de la caja y el bigote).
La distribución de los datos en ambos grupos, muestra sesgo a la derecha (o edades superiores). Si se hiciera un histograma presentaría una cola larga a la derecha (o valores máximos). Se puede decir, que la mayor cantidad de las personas de este estudio, son jóvenes y sólo un 25% pasan del tercer cuartil, es decir, 24 o 25 años de edad, en el grupo de las mujeres y hombres respectivamente.
Comentarios
Publicar un comentario