Ir al contenido principal

Tablas de Distribución de Frecuencias

Tablas de Distribución de Frecuencias

Las tablas de distribución de frecuencias, permiten organizar un conjunto de datos y resumirlos en frecuencias, de manera tal que se pueda visualizar la distribución de éstos; determinándose los valores de la distribución en donde se concentran o agrupa la mayor cantidad de observaciones, o  por el contrario, aquellos que tienen menor frecuencia.

Se llama frecuencia absoluta o frecuencia, al conteo de las repeticiones de los datos, la que se ha de representar con fi. La frecuencia relativa (fr), corresponderá a la relación entre la frecuencia absoluta y el total de las frecuencias.

Estas tablas de distribución, se pueden clasificar en Tablas de distribución de frecuencias y Tablas de distribución de frecuencias en datos agrupados. Veamos esto con un ejemplo, para diferenciarlas.

En esta tabla la variable consumo de chocolates semanales, toma valores de 0 a 7, en una muestra de 122 individuos u observaciones, es decir, que el conjunto de observaciones es grande con poca variabilidad en los valores de la variable, lo que representa con claridad la distribución de las frecuencias de los datos.



Cuando se observa una cantidad de datos grande y mucha variabilidad en los datos, lo recomendable es agrupar los datos en clases. Por ejemplo, la variable estatura (m), es una variable con un rango de variabilidad de 1.00 a 1.39, además, de ser de tipo cuantitativa continua. Se observa en las clases de las estaturas que estas se ha estructurado en intervalos cerrados en ambos límites.

Las frecuencias absoluta y la frecuencia relativa, dan información del valor correspondiente, es decir, la magnitud del valor al cual pertenece la frecuencia. Mientras que las frecuencias acumuladas, parten de la frecuencia inicial y agrega a la segunda clase la frecuencia correspondiente, por ejemplo,
 la primera clase tiene 12 observaciones, pero la segunda tiene 22. Cuando se suman ambas frecuencias o se acumulan, la segunda clase, ahora totaliza 34. Esta frecuencia está acumulada, e indica que hasta la estatura 1.09 m, se agrupan 34 niños, que a su vez, representan 0.28 del total, o el 28% de los niños en total.
La técnica de agrupación de los datos, conlleva los siguientes pasos:

1. Calcular el rango de variabilidad de los datos: Rango= Valor máximo - Valor mínimo
2. Determinar el número de clases o grupos de datos: K = 1+ [3.322*log(n)], esta fórmula se conoce como fórmula de Sturges. El resultado, se podrá aproximar al siguiente entero. n, es la cantidad de datos. Otras formas de estimar el número de clases, es mediante, el cálculo de la raíz cuadrada de n.
3. Determinar la Amplitud de las clases: A = R / K.

Este procedimiento, resulta ser una guía muy útil cuando no se disponen de normas previas para la agrupación de los datos en determinadas variables.

Los intervalos o clases, también pueden ser construidos como intervalos semiabiertos por la derecha; es decir, cerrados a la izquierda y abiertos a la derecha, indicando que se incluye el valor izquierdo del límite, más no el valor derecho. Este proceso también facilita posteriormente, cálculos estadísticos y la elaboración de gráficas.

Es importante observar que las clases mantienen un mismo ancho, característica desea en las tablas de frecuencias.




Comentarios

Entradas populares de este blog

Cajas y Bigotes

Las gráficas de Cajas y Bigotes, son muy utilizadas para comparar distribuciones de los datos de dos o más grupos. Por lo general, en esta gráfica emplea como medidas los valores mínimo y máximo y los cuartiles, los cuales son representados por una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico . Este rectángulo está dividido por un segmento vertical (o un punto) que indica donde se posiciona la mediana y por lo tanto su relación con el primer y tercer cuartil. El rango intercuartículo, se puede calcular como la diferencia entre el valor del tercer cuartil y el valor del primer cuartil. RI = Q3 - Q1 Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes . Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un val...

Introducción a la Estadística para Geógrafos Profesionales

Introducción En la actualidad la Estadística además de ser una ciencia, se ha convertido en una gran herramienta científica para la sustentación de conclusiones basadas en evidencias. Esto es que, en la medida que se reconozca la importancia de producir datos de calidad, y que estos son el insumo fundamental para todo tipo de análisis estadístico, la aplicación de la metodología científica y la continua búsqueda del conocimiento, se elevará el nivel de calidad y la producción de investigaciones. La sociedad podrá no sólo ser productores de investigaciones científicas, sino también utilizar la metodología estadística para desarrollar actividades tecnológicas o de innovación. El siglo XXI se ha denominado el siglo de la sociedad del conocimiento, la información y la tecnología; el desarrollo de programas computacionales, la intensificación del uso de las redes sociales para múltiples propósitos; el desarrollo innovador de formas de comunicación y de mantenerse informado conlleva...