Ir al contenido principal

Presentación de datos

Organización y Presentación de datos

Los datos son los insumos principales de la Estadística. Nos hemos de referir a los datos como un valor o cualidad que se obtiene como resultado de la medición u observación de una característica (variable).

Variable: Característica que adquiere dos o más valores o resultados distintos.

Ejemplo:

Variable:  Estatus laboral, posibles resultados o respuestas: Trabaja, No trabaja.

El dato es la respuesta que se obtiene al preguntar, por ejemplo, a una persona su estatus laboral

Estatus laboral     ------ Labora
Variable               ------ Dato

Los datos por sí sólo no nos dicen mucho sobre lo que estemos estudiando, pero un conjunto de datos  más que una idea de algo, nos da información.

La organización de estos datos, se basa en su ordenamiento o en la estructuración en una tabla de datos.

Los datos podrán ser procesados de forma manual o mediante el uso de programas computacionales, como hojas de cálculos o programas estadísticos.

Por lo general, los datos se organizan en una matriz de doble entrada, en donde las columnas corresponden a las variables de estudio y en las filas, los registros individuales.

Diagrama de Tallo y Hoja



Los diagramas de tallo hoja, corresponden a una estructura de dos columnas principales y filas múltiples. En donde la primera columna se titula tallo y la segunda columna llamada Hojas, se subdivide en múltiples columnas, tal como se observa en el ejemplo.

Veamos, si tenemos los siguientes datos que se refieren a los tiempos en la ejecución de una tarea en minutos, una forma de organizarlos es mediante el diagrama de tallo-hoja.

17 28 21 25 31 26 33 41 24

Lo primero es que dividen los números, separando la unidad de la decena. Los dígitos de la decena se ordenan sin repetición en la columna llamada tallo, los dígitos de las unidades de los números se ordenan en cada fila de la decena ubicada en la columna del tallo, así:

Tallo      Hojas
1 7
2
3

Este proceso se realiza para cada número. Al finalizar, deben haber tantas hojas (unidades) como datos ordenados.






En el ejemplo, se observan 9 hojas (unidades), totalizando la cantidad de datos originales.


A continuación, se complementa esta información con diapositivas preparadas para este tema.




Comentarios

Entradas populares de este blog

Cajas y Bigotes

Las gráficas de Cajas y Bigotes, son muy utilizadas para comparar distribuciones de los datos de dos o más grupos. Por lo general, en esta gráfica emplea como medidas los valores mínimo y máximo y los cuartiles, los cuales son representados por una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico . Este rectángulo está dividido por un segmento vertical (o un punto) que indica donde se posiciona la mediana y por lo tanto su relación con el primer y tercer cuartil. El rango intercuartículo, se puede calcular como la diferencia entre el valor del tercer cuartil y el valor del primer cuartil. RI = Q3 - Q1 Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes . Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un val

Tablas de Distribución de Frecuencias

Tablas de Distribución de Frecuencias Las tablas de distribución de frecuencias, permiten organizar un conjunto de datos y resumirlos en frecuencias, de manera tal que se pueda visualizar la distribución de éstos; determinándose los valores de la distribución en donde se concentran o agrupa la mayor cantidad de observaciones, o  por el contrario, aquellos que tienen menor frecuencia. Se llama frecuencia absoluta o frecuencia, al conteo de las repeticiones de los datos, la que se ha de representar con fi . La frecuencia relativa ( fr ), corresponderá a la relación entre la frecuencia absoluta y el total de las frecuencias. Estas tablas de distribución, se pueden clasificar en Tablas de distribución de frecuencias y Tablas de distribución de frecuencias en datos agrupados. Veamos esto con un ejemplo, para diferenciarlas. En esta tabla la variable consumo de chocolates semanales, toma valores de 0 a 7, en una muestra de 122 individuos u observaciones, es decir, que el con

Introducción a la Estadística para Geógrafos Profesionales

Introducción En la actualidad la Estadística además de ser una ciencia, se ha convertido en una gran herramienta científica para la sustentación de conclusiones basadas en evidencias. Esto es que, en la medida que se reconozca la importancia de producir datos de calidad, y que estos son el insumo fundamental para todo tipo de análisis estadístico, la aplicación de la metodología científica y la continua búsqueda del conocimiento, se elevará el nivel de calidad y la producción de investigaciones. La sociedad podrá no sólo ser productores de investigaciones científicas, sino también utilizar la metodología estadística para desarrollar actividades tecnológicas o de innovación. El siglo XXI se ha denominado el siglo de la sociedad del conocimiento, la información y la tecnología; el desarrollo de programas computacionales, la intensificación del uso de las redes sociales para múltiples propósitos; el desarrollo innovador de formas de comunicación y de mantenerse informado conlleva