Ir al contenido principal

Cajas y Bigotes

Las gráficas de Cajas y Bigotes, son muy utilizadas para comparar distribuciones de los datos de dos o más grupos.


Por lo general, en esta gráfica emplea como medidas los valores mínimo y máximo y los cuartiles, los cuales son representados por una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical (o un punto) que indica donde se posiciona la mediana y por lo tanto su relación con el primer y tercer cuartil. El rango intercuartículo, se puede calcular como la diferencia entre el valor del tercer cuartil y el valor del primer cuartil. RI = Q3 - Q1

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un valor extremo, u outliers.


Este gráfico se puede representar en forma vertical, u horizontal, la información que presenta es la misma.

Una distribución simétrica dará idea de una distribución de datos normal. Por el contrario, si uno de los bigotes es más largo que otro, sugerirá sesgo en la distribución hacia el lado más largo.
El siguiente diagrama de cajas y bigotes muestra de forma comparativa la distribución de las edades de hombres y mujeres.

En esta gráfica comparativa de la edad de hombres y mujeres, se observa que la edad mínima en ambos grupos es la misma, es decir, 18 años. No así la edad máxima. Pues el grupo de las mujeres presenta una edad máxima de 29 años y el de hombres de 28 años de edad.
Los cuartiles 1 y 3, y la mediana de ambos grupos, son diferentes también. En el grupo de las mujeres el primer cuartil y la mediana coinciden con el valor mínimo (por eso no hay bigote inferior). Esto quiere decir que el 50% de las chicas tienen 18 años de edad y el otro 50%, más de 18 años.
En el grupo de los hombres, el primer cuartil es de 19 años y la mediana de 20 años de edad. Esto quiere decir, que el 25% de los hombres tienen hasta 19 años de edad, y otro 25% tienen 20 años. El 50% restante supera los 20 años de edad (es el lado opuesto y más largo de la caja y el bigote).
La distribución de los datos en ambos grupos, muestra sesgo a la derecha (o edades superiores). Si se hiciera un histograma presentaría una cola larga a la derecha (o valores máximos). Se puede decir, que la mayor cantidad de las personas de este estudio, son jóvenes y sólo un 25% pasan del tercer cuartil, es decir,  24 o 25 años de edad, en el grupo de las mujeres y hombres respectivamente. 

Comentarios

Entradas populares de este blog

Tablas de Distribución de Frecuencias

Tablas de Distribución de Frecuencias Las tablas de distribución de frecuencias, permiten organizar un conjunto de datos y resumirlos en frecuencias, de manera tal que se pueda visualizar la distribución de éstos; determinándose los valores de la distribución en donde se concentran o agrupa la mayor cantidad de observaciones, o  por el contrario, aquellos que tienen menor frecuencia. Se llama frecuencia absoluta o frecuencia, al conteo de las repeticiones de los datos, la que se ha de representar con fi . La frecuencia relativa ( fr ), corresponderá a la relación entre la frecuencia absoluta y el total de las frecuencias. Estas tablas de distribución, se pueden clasificar en Tablas de distribución de frecuencias y Tablas de distribución de frecuencias en datos agrupados. Veamos esto con un ejemplo, para diferenciarlas. En esta tabla la variable consumo de chocolates semanales, toma valores de 0 a 7, en una muestra de 122 individuos u observaciones, es decir, que el con

Introducción a la Estadística para Geógrafos Profesionales

Introducción En la actualidad la Estadística además de ser una ciencia, se ha convertido en una gran herramienta científica para la sustentación de conclusiones basadas en evidencias. Esto es que, en la medida que se reconozca la importancia de producir datos de calidad, y que estos son el insumo fundamental para todo tipo de análisis estadístico, la aplicación de la metodología científica y la continua búsqueda del conocimiento, se elevará el nivel de calidad y la producción de investigaciones. La sociedad podrá no sólo ser productores de investigaciones científicas, sino también utilizar la metodología estadística para desarrollar actividades tecnológicas o de innovación. El siglo XXI se ha denominado el siglo de la sociedad del conocimiento, la información y la tecnología; el desarrollo de programas computacionales, la intensificación del uso de las redes sociales para múltiples propósitos; el desarrollo innovador de formas de comunicación y de mantenerse informado conlleva