Ir al contenido principal

Introducción a la Estadística para Geógrafos Profesionales

Introducción

En la actualidad la Estadística además de ser una ciencia, se ha convertido en una gran herramienta científica para la sustentación de conclusiones basadas en evidencias. Esto es que, en la medida que se reconozca la importancia de producir datos de calidad, y que estos son el insumo fundamental para todo tipo de análisis estadístico, la aplicación de la metodología científica y la continua búsqueda del conocimiento, se elevará el nivel de calidad y la producción de investigaciones. La sociedad podrá no sólo ser productores de investigaciones científicas, sino también utilizar la metodología estadística para desarrollar actividades tecnológicas o de innovación.
El siglo XXI se ha denominado el siglo de la sociedad del conocimiento, la información y la tecnología; el desarrollo de programas computacionales, la intensificación del uso de las redes sociales para múltiples propósitos; el desarrollo innovador de formas de comunicación y de mantenerse informado conlleva a que la Estadística sea un tema del diario vivir; pues los ratings, las encuestas cortas o sondeos de Internet; la contabilización de usuarios de determinados sitios virtuales, o el uso de la tecnología son algunos ejemplos del uso de métodos estadísticos.
La exorbitante producción de datos en todos los campos del saber es el resultado de la agobiante necesidad de información sobre los distintos hechos que conllevan a análisis, descripción, interpretación, conocimiento que posibilita anticipar acciones o permiten un intento de predicción de posibles hechos en un futuro cercano, mediano o largo plazo. Sin embargo, el meollo del asunto se centra en la calidad del dato en todo el sentido de la palabra. Pues, no es desconocido que el insumo principal de la Estadística es el Dato, y que su propósito va más allá de describir algo.
En el campo de la Geografía, las aplicaciones de la Estadística, es fundamental toda vez que el campo de acción de esta disciplina es amplio. La Geografía como ciencia que estudia el espacio geográfico, que comprende las interacciones entre un ecosistema, sus características, sus habitantes y actividades, se clasifica en dos grandes grupos como lo son: la Geografía Humana y la Geografía Física. Aspectos en los cuales la producción de datos se intensifica motivado por la necesidad de información relevante a los diversos tópicos del diario acontecer.
Desde el punto de vista analítico, la Geografía se clasifica también en Geografía cualitativa y Geografía cuantitativa. Esta última, ha sido definida desde un punto de vista operativo, por Johnston (1981), según la cual la Geografía cuantitativa sería aquella (ciencia) que utiliza modelos matemáticos y análisis estadísticos y no únicamente la manipulación aritmética de los datos[1].
La aplicación de las técnicas descriptivas juega un papel importante en el análisis de los datos, puesto que permiten la reducción o la síntesis de un gran número de datos mediante la obtención de las medidas estadísticas de tendencia central, de dispersión, las medidas no centrales y de formas. Además del método gráfico, en donde la observación de los datos en términos del tiempo, es decir, de índole histórico es uno de los análisis frecuentes realizados en este campo.
Otras técnicas muy utilizadas son las de regresión y correlación de variables, así como las técnicas de análisis de series de tiempo. En lo que se busca modelar matemáticamente relaciones de variables con propósitos, por ejemplo, de explicar fenómenos o de predicción de la posible ocurrencia de determinados eventos. Técnicas que permiten organizar los datos, deduciendo el porcentaje en que la varianza de una variable dependiente es explicada por una variable independiente o por un conjunto de estas.
En la revisión de la literatura, se pueden encontrar testimonios y aplicaciones de la Estadística en la Geografía. Algunos de estos, se ilustran a continuación.
La Geografía y la Estadística se complementan (INEGI, México)
Los datos estadísticos que se refieren a la población o a la economía pueden enriquecerse si se ubican en el espacio geográfico que les da origen. A esto se le llama georreferenciar y permite, por ejemplo: localizar dónde están las personas y sus viviendas, los establecimientos económicos y las unidades de producción agropecuaria y/o forestal, entre otras cosas.
Se pueden georreferenciar datos estadísticos en mapas impresos o digitales, así como en sistemas de información geográfica, en los cuales el usuario elige, en un menú, la información estadística que desea ver representada en un mapa, ya sea en el territorio nacional o en alguna región o lugar específico. (Sitio web: http://cuentame.inegi.org.mx/ayuda/estgeo.aspx?tema=A)

La Importancia de las Estadísticas y la Geografía para el Desarrollo - (Asociación de Estados del Caribe -AEC)
Vivimos en una sociedad global de la información, en la que está creciendo el monto de información y su flujo hacia la sociedad. Muchos reconocen en este momento que las estadísticas juegan un papel de envergadura en la conformación y suministro de información científica útil en casi todos los aspectos de la vida humana. La toma de decisiones en la era moderna, ya sea por el Gobierno nacional o por una agencia internacional, utiliza cada vez más métodos estadísticos para mejorar la calidad de la información. 
 Esta mayor consideración del papel, poder e importancia de las estadísticas está llevando ahora a la concesión de una mayor prioridad al desarrollo de la capacidad en materia de estadísticas en muchos de los países en desarrollo. El “Panel de Expertos de Alto Nivel para la Agenda de Desarrollo Post 2015”, establecido por las Naciones Unidas, y su Informe titulado Una Nueva Alianza Mundial: Erradicar la Pobreza y Transformar las Economías a través del Desarrollo Sostenible, define, entre otros elementos, una agenda universal para erradicar la pobreza extrema de la faz de la tierra para el 2030 y cumplir con la promesa del desarrollo sostenible. El Informe hace un llamado hacia una revolución de los datos en aras del desarrollo sostenible, con una nueva iniciativa internacional para mejorar la calidad de las estadísticas y la información al alcance de los ciudadanos. (Sitio web: http://www.acs-aec.org/index.php?q=es/disaster-risk-reduction/la-importancia-de-las-estadisticas-y-la-geografia-para-el-desarrollo)
El soporte tecnológico, computacional y programas especializados se encuentran asequibles en el mercado para permitir acceso más rápido y eficiente a resultados de la aplicación o uso de las técnicas Estadísticas. La elaboración de tablas y gráficas, la comprobación de hipótesis, el desarrollo de análisis de correlación y regresión, o el análisis de pruebas experimentales, son mucho más fáciles de realizar apoyándose en dichas herramientas. A los profesionales usuarios de la estadística, le queda poder apropiarse de los conceptos Estadísticos y proceso metodológico para lograr buenos análisis. Nuevamente, enfatizo en la importancia y la necesidad de la producción de datos de calidad, es imperante que los datos sean precisos, válidos, pertinentes y que se eviten las omisiones, pues estos datos son el pilar de toda investigación científica.

La ausencia de datos, o la presencia de datos erróneos son la causa principal de que los sistemas de información estadística o bien estén obsoletos, desactualizados o simplemente, inoperantes. Sin embargo, es una necesidad palpable la obtención de información actualizada, más no prevalece en nuestro país una cultura estadística para contribuir al sostenimiento de una buena colección de datos con las características deseables. Esto motiva a la exhortación a continuar trabajando en el fomento de esta cultura para propiciar, no solamente una producción de datos de calidad, sino un uso adecuado de estos para la toma de decisiones y la planificación de los recursos.

H. G. Wells, también llamado el hombre que veía el mañana, fue quien, con espíritu de descubrimiento científico, parafraseó que en poco tiempo para un ciudadano eficiente del nuevo y tan complejo mundo que se está desarrollando ahora, sería requisito poder calcular y pensar en promedios, máximos y mínimos, lo que hoy es como aprender a leer y escribir.



Módulo 1. Conceptos Generales


Es común que en los tiempos actuales se hable del tiempo. Fenómenos del Niño o de la Niña que afectan y modifican el espacio geográfico es parte de los acontecimientos que vive la sociedad a diario. La producción agrícola, es un ejemplo de estos efectos. Estos fenómenos asociados con el clima, con los recursos hídricos, la temperatura del ambiente, la precipitación pluvial, conllevan a mediciones frecuentes de múltiples variables mediante las cuales se trata de comprender dicho fenómeno y la búsqueda a su vez de posibles soluciones ante la amenaza de consecuencias mayores, como la falta de alimentos.

 










También se observan datos estadísticos como los siguientes:

Fig.  1. Pronóstico del tiempo. Panamá. Tomado de Hidromet.com.pa
En esta figura, se observan variables o características que se miden en el tiempo, como lo son Humedad relativa, Temperatura, Región y Jornada o período del día. Este tipo de síntesis de datos estadísticos, proveen información valiosa a los tomadores de decisiones. Sumamente útil, tanto para las personas en sus actividades de recreación, como para quienes se dedican a actividades en la construcción, agropecuarias o de navegación, por ejemplo.

Comprendiendo la importancia, de los datos en la toma de decisiones, podríamos entonces, imaginarnos por un momento, ¿cómo sería nuestra sociedad sin este tipo de información?

La colección de los datos, como insumo principal de la Estadística, conlleva un proceso el cual inicia por la necesidad de información. Esta colección de datos, se realizará de acuerdo a determinadas características o propósitos. Contemplará una cantidad determinada (muestra o censo), será delimitada a ciertos elementos (cualidades, tiempo, espacio), y se obtendrá sobre ciertas variables de interés.
La Estadística se definen como una ciencia, que cuenta con métodos y técnicas desarrolladas para la recolección, organización, procesamiento, interpretación, análisis y toma de decisiones. Contribuye a la generación de nuevos conocimientos basados en una metodología propia y a su vez relacionada con el Método científico. La Estadística aplicada a cualquier campo del saber adquiere contexto, por ejemplo, la estadística aplicada en el campo de la salud y la vida, es denominada Bioestadística; en el campo económico, tal vez la conozcan como Econometría o en el de la Geografía, Geoestadística.

Fig.  2. Etapas de la metodología estadística
 
 

La Metodología Estadística es sistémica, puesto que inicia con los datos, continúa con un proceso de ordenamiento y presentación de datos, que puede ser en tablas, gráficas o numérica y concluye con resultados obtenidos de la aplicación de técnicas de análisis y sus interpretaciones que pueden llevar o no a la toma de decisiones, lo cual dependerá de los objetivos por el cual se inicia el proceso. En cada una de las etapas, la Estadística como tal juega un papel importante, ya que incide mediante métodos en los procesos.
En la etapa de la recolección de los datos, se emplean conceptos estadísticos para definir variables, instrumentos y técnicas de muestreo o métodos para la recolección de los datos. En el de organización y procesamiento de los datos, se cuentan con técnicas de resúmenes y ordenamiento como lo son la elaboración de las tablas, cuadros estadísticos, las técnicas descriptivas numéricas; y en la etapa de análisis, se cuentan con una gama de métodos y técnicas estadísticas que se emplearán de acuerdo a los propósitos del estudio.
La validez y confiabilidad de los resultados obtenidos, se corresponderán con las buenas prácticas de la metodología y el empleo apropiado de las diferentes técnicas en cada una de las etapas de la metodología. La verificación de la calidad de los datos, el cumplimiento de supuestos para aplicación de las técnicas estadísticas, de los estadísticos de bondad de ajustes y el análisis de los errores o desviaciones típicas son por mencionar, algunos de los criterios a validar en los diferentes procesos.
Tal como se ha mencionado, una vez recolectado los datos, estos pueden ser resumidos y presentados de distintas formas tales como:
·         Tablas de frecuencias
·         Cuadros Estadísticos
·         Gráficas
·         Números
·         Texto

Las ramas de la Estadística, son dos: La Estadística descriptiva y la Estadística Inferencial. En la primera, el propósito se fundamenta en describir un fenómeno u hecho basado en datos. Estos datos, se recolectan, se ordena u organizan, se procesan y se presentan en las formas mencionadas para ser interpretadas, más no se pretende generalizar estos resultados a un “todo” o población.
Por su parte, la Estadística Inferencial, como su nombre lo dice, se encarga de producir estadísticas para “generalizar a un todo”. Esta generalización o inferencia de los datos a la población, debe partir de muestras representativas de la población. Su aplicación, radica en que, al no poder contar con todos los datos de la población de estudio, se desconoce el verdadero valor o estadístico poblacional, por lo que se hace necesario estimar ese valor en función de los datos muestrales con el fin de obtener conclusiones que conlleven a una toma de decisiones.

 


Fig.  3. Ramas de la estadística
De manera resumida:
Cuando el objetivo es sólo describir datos, se emplea fundamentalmente las técnicas de organización, presentación y descripción de datos de la estadística descriptiva, a través de tablas de frecuencias, cuadros, gráficas o medidas numéricas que resumen todos los datos en estadísticas que dicen sobre el fenómeno estudiado. Si el objetivo es obtener conclusiones a partir de muestras probabilísticas para inferir a la población, por medio de hipótesis; entonces las técnicas de la estadística inferencial serán las más apropiadas.

1.1.       Conceptos básicos.


En un proceso de investigación, la iniciativa se origina por el hecho de querer conocer sobre el comportamiento de hechos o sucesos que son de interés, ya sea para describir, para correlacionar o tratar de explicar su comportamiento. El insumo principal para lograr estos objetivos, es el dato. El dato, provee una idea de algo; un conjunto de datos, ayudará a construir un concepto de algo.

Es común realizar estudios basados en sólo unos cuantos datos provenientes de registros o formularios; o sobre algunas personas, animales, plantas o cosas, estos últimos se conocerán como los elementos de la población de estudio. Más en la geografía, el dato espacial juega un papel preponderante y dinámico; pues “el espacio físico”, es una de las principales características, basadas en coordenadas o posiciones geográficas.
Según, Madrid y Ortiz, (2012), los datos son inherentes al análisis espacial, estos permiten identificar y caracterizar los componentes del espacio y no puede negarse que un tratamiento adecuado de los mismos permite construir esquemas de funcionamiento del espacio, hacer visibles algunas de sus relaciones y hasta descubrir sus regularidades e irregularidades.
De acuerdo al número de variables incluidas en la aplicación de una técnica de análisis estadístico, se pueden clasificar en Análisis Univariado, es decir, se realiza el análisis estadístico con cada variable en forma individual sin pretender explicar o relacionar otras variables; Bivariado si solo se incluyen en el análisis dos variables con la finalidad de observar relación entre estas; o Multivariado si se incluyen más de dos variables en el análisis.

1.1.1.   Población y Muestra

La definición de la Población de estudio, es fundamental en los análisis. Puesto que la población de estudio está delimitada en tiempo y espacio además de las características de los elementos de interés. Una población, en Estadística, puede referirse no sólo a personas, sino a objetos, plantas o animales. El conjunto total de las unidades o elementos que interesan estudiar se denomina población o universo.
La toma de decisiones, por lo general, se basa en sólo una parte de la población, es decir, no se analizan “todos” los datos de la población”, ya que esto es muy costoso, o requiere de más tiempo el registro y procesamiento de los datos. De manera, que por lo general el estudio de los datos se basa en sólo una parte de la población, reduciendo el número de registros a unos cuantos. Este subconjunto de datos se denomina muestra.
Lo importante de esto es que la parte de los datos o subconjunto de datos seleccionados para estudiar, debe reunir características de representatividad de la población, ya que, con los resultados obtenidos de la muestra, se quiere decidir sobre la población o generalizar las medidas estadísticas resultantes como estimaciones de las verdaderas estadísticas poblacionales.
Cuando las mediciones se realizan a todos los elementos de la población, se dice que se ha realizado un Censo. Por otro lado, cuando en la investigación se analiza una parte de la población (o un subconjunto), entonces, se ha realizado un Muestreo.





Fig.  4. Síntesis de conceptos básicos de estadística
El muestreo en sí, es el proceso metódico empleado para seleccionar un subconjunto o una parte de los elementos de la población (muestra) y de la cual se obtendrán mediciones de las características, objeto de la investigación.
El Censo, puede ser utilizado:
·         Cuando la población es relativamente pequeña, de manera que permite el estudio de todos sus elementos.
·         Para el estudio de características que no cambian frecuentemente,
·         También, para conocer las estadísticas de la población (parámetros) que a su vez sirven al muestreo.
En Panamá, cada diez años, se realiza el Censo de Población y vivienda, este censo provee información importante sobre la población panameña en diferentes tópicos sociales, de salud, económico, educativo, y otros. Es un estudio que requiere de muchos recursos y la cooperación de todos los habitantes del país al momento de su realización. Las Estadísticas obtenidas son de gran utilidad en los distintos sectores económicos, políticos, sociales y culturales del país.
Las Estadísticas obtenidas en el Censo, se denominan Parámetros. Estos, representan totales, porcentajes o promedios de toda la población de estudio.
En la actualidad, el uso del muestreo resulta de gran importancia en todas las investigaciones de todos los campos del saber, ya que.
·           Resulta ser menos costoso,
·           Necesita menor inversión de tiempo en la obtención de la información y en la preparación de materiales, en personal y en otros recursos.
·           Es posible analizar más detalles y más características de interés,
·           En muchos casos, el muestreo permite obtener mejor información,
·           El muestreo, también es utilizado para complementar al censo, evaluar la calidad de los datos y la cobertura de la investigación.
Las Estadísticas obtenidas de muestreos, se denominan Estimaciones. Estas estimaciones, si se ha utilizado un buen diseño de muestreo, proporcionarán resultados estadísticos sino iguales, aproximados a los parámetros que se obtendrían en un censo.
De la selección de la muestra, depende la calidad de los datos y la confiabilidad de sus resultados.
En la realización de censos o estudios por muestreo que realiza el Instituto de Estadística y Censo (INEC) de la Contraloría General de la República, la cartografía es muy importante. En la cartografía, los datos espaciales, se refieren a puntos de localización o georreferencias definidos de forma lineal, puntual, segmento o zonas.

1.1.2.   Variables

Las variables son las características numéricas o no numéricas, observadas o medibles en los elementos estudiados, y que pueden tomar distintos valores al ser medida en cada elemento. Se representan con letras mayúsculas, por ejemplo, X, Y, Z.
 Frecuentemente, de una unidad o elemento se extraen más de un dato. El dato es la unidad más pequeña de la estadística, que corresponde a una variable; por lo tanto, varias variables producirán varios datos. Estos se representan simbólicamente, como x, y, z (letras en minúsculas).


 



Fig.  5. Ejemplo. Elementos de análisis de una Comunidad. Imagen tomada de USAID-PERÚ, http://comunidadsaludable.org/pagina/el-proyecto_herramientas-com-salud/


La definición de las variables debe considerar un proceso de definición de la medición a realizarse e inclusive la designación de los valores o rango y unidades a ser considerados en su medición.

1.1.3.   Escalas de Medición de variables

El diseño del proceso de recolección de datos, es antecedido por los propósitos de las variables a ser medidas u observadas. Las variables podrán ser medidas de diferentes formas y con distintos niveles de complejidad. En cuanto a la medida de las variables, estas establecen algún grado de relación matemática entre sus categorías o datos. Los análisis estadísticos dependerán de las escalas de medidas de las variables.
Las escalas de medición se refieren a los posibles valores o atributos (categorías) que una variable puede tomar. Será importante que estas categorías cumplan propiedades exhaustivas y mutuamente excluyentes. Es decir, que comprendan todas las categorías posibles a medir y que las mismas no se traslapen.
Por lo general, se clasifican en cuatro tipos de escalas:
Nominal: Se refieren a las variables categóricas o no numéricas, que se distinguen por ser “Nombres”, que no expresan orden, ni magnitudes, sino más bien pertenencia a un grupo o categoría o cualidad. La única relación matemática que se establece entre las categorías de la variable es de igualdad o desigualdad. En los análisis estadísticos, estas variables, sólo permiten el cálculo de la Moda y la aplicación de algunas pruebas inferenciales No paramétricas.
Ejemplo: Sexo, Región o Zona, Grupo étnico.
Si las categorías de Sexo son, por ejemplo: Hombre y Mujer, la relación matemática de estas categorías, es que Hombre y Mujer, se ubican en el mismo nivel de categoría o en distintos niveles, pero que estos niveles serán designados por criterios de orden de magnitud de frecuencias, alfabético o regional, y de ningún modo expresarán que los hombres son más valiosos que las mujeres, o viceversa.

Ordinal: Son Variables categóricas o no numéricas, de clasificación que establecen orden o importancia, o categorías que por sí sola expresan un orden de magnitud. La relación matemática entre los valores que asumen las categorías, pueden ser de igualdad/desigualdad y organizar las categorías en mayor y menor. Más no se puede establecer distancias entre categorías.
Ejemplos: Nivel Educativo, Calidad de atención, Percepción de la contaminación en el país.
Si las categorías de la variable Nivel educativo, son Primaria, Secundaria y Universidad, su sólo nombre permite ordenarlas de mayor a menor nivel educativo, por ejemplo. Si es la percepción, se pueden establecer categorías de orden como Mucho, Regular, Poco o Nada, pero que no puede establecer una diferencia cuantitativa entre dos categorías.
Intervalos: Son Variables Numéricas, cuyo “cero” es un valor arbitrario que no significa ausencia de valor. Al ser numérica, sus valores expresan no sólo magnitud, sino orden y distancia entre dos puntos (categorías) de la escala. Aún en esta categoría de escalas de medidas, las operaciones matemáticas como división (razón) o multiplicación no tienen sentido al no tener un cero real. Los análisis estadísticos incluyen la moda, mediana y la media aritmética o promedio.
Un ejemplo de este tipo de escala de medición, muy común, es el que se refiere a la Temperatura.
Si dos puntos de la escala de medida son, por ejemplo, 30°C y 35°C de temperatura la distancia entre 30 y 35 grados es la misma que la existente entre 15°C y 20°C. Lo que no se puede establecer es que una temperatura de 30 grados equivale es dos veces más que una temperatura de 15 grados.
Otros ejemplos, son: la comparación de las mediciones entre las temperaturas de escalas “Farenthait” y “Celcius”. Este es un ejemplo clásico de “cero” arbitrario, ya que decir cero grados no implica la ausencia absoluta de temperatura. También la medición en un test psicométrico, una prueba de rendimiento o las calificaciones universitarias en las que se establece un punto “cero” arbitrario.

Una acotación importante, entre las categorías ordinales numéricas que expresan grados de satisfacción, calidad o percepción, por ejemplo, es que algunos investigadores convienen en llevar estas escalas a análisis estadísticos considerando la variable como intervalar. Las recomendaciones realizadas por algunos estadísticos, (Richtey, 2002, citado por Coronado Padilla), es que las categorías de la escala, deben considerar mínimo siete (7) niveles, entre más niveles de categorías hay, mucho mejor será el análisis estadístico, aunque siempre con teniendo cuidado con las interpretaciones que se originan a raíz de sus resultados.[2]

Razón: Se refiere a la variable numérica, de las que el “cero” es absoluto, significando la ausencia de la categoría. Puede establecerse la relación entre dos categorías (razones, proporciones), la distancia y el orden (mayor que, o menor que), entre las categorías de las variables. En cuanto a los análisis estadísticos, las variables “racionales”, permiten la más amplia aplicación de técnicas estadísticas.
Ejemplos: Peso, Salario, Velocidad, Tiempo, Longitud.

Las dos primeras escalas de medición, se agrupan en la categoría de variables cualitativas o categóricas. Y las escalas de medición de Intervalo y de Razón en las variables de tipo cuantitativo.

Las variables de tipo cuantitativo, presentan otro tipo de clasificación de acuerdo a la forma de la cuantificación, si los datos pertenecen a un conteo se denomina variable cuantitativa discreta; si resultan de una medición, variable cuantitativa continua. La primera pertenece al conjunto de los números naturales y la segunda, al de los números reales.

Fig.  6. Clasificación de variables, en el campo de la cartografía. Tomado de: Documento Conceptos cartográficos. España

 

Fig.  7. Tipos de variables y Escalas de medición




1.2.       Organización de los datos en bases de datos.


Existen diferentes formas de organizar los datos en tablas para su posterior análisis computarizado. Lo más común es utilizar una estructura de matriz de datos donde las columnas corresponderán a cada variable y cada fila representará un registro de una unidad o elemento de análisis (persona, coordenadas geográficas, etc.).
Unidad / - Variables
Variable 1
Variable 2
Variable k
Unidad 1
Dato 11
Dato 12

Dato 1k
Unidad 2
Dato 21


Dato 2k
.




.




.




Unidad j
Dato j1


Dato jk
Fig. 7. Ejemplo de la organización de datos en una tabla de datos

Si los datos recolectados se refieren a datos poblaciones de una determinada región, la organización de los datos será:
Persona
SEXO
Edad
Estatus laboral
Escolaridad (años cursados)
1
F
84
Trabaja
15
2
F
5
No trabaja
2
.
M
..
..
..
.
M
..
..
..
.
..
..
..
Fig. 8. Ejemplo de la organización de datos en una tabla de datos

La organización de los datos es sumamente importante para el procesamiento de los datos en el programa informático, en este caso, Microsoft Excel o cualquier otro programa estadístico como SPSS o STATISTICA, por ejemplo.



[1]  Bosque, J.; Rodríguez, V.; Santos Preciado, J.; LA GEOGRAFIA CUANTITATIVA EN LA UNIVERSIDAD Y LA INVESTIGACION ESPAÑOLA. UNIVERSIDAD DE BARCELONA ISSN: 0210-0754 Depósito Legal: B. 9.348-1976 Año VIII. Número: 44 abril de 1983
[2] Ritchey Ferris, Estadística para las ciencias sociales. México: McGraw Hill, 2002; p. 45.

Comentarios

Entradas populares de este blog

Cajas y Bigotes

Las gráficas de Cajas y Bigotes, son muy utilizadas para comparar distribuciones de los datos de dos o más grupos. Por lo general, en esta gráfica emplea como medidas los valores mínimo y máximo y los cuartiles, los cuales son representados por una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico . Este rectángulo está dividido por un segmento vertical (o un punto) que indica donde se posiciona la mediana y por lo tanto su relación con el primer y tercer cuartil. El rango intercuartículo, se puede calcular como la diferencia entre el valor del tercer cuartil y el valor del primer cuartil. RI = Q3 - Q1 Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes . Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente, como un val

Tablas de Distribución de Frecuencias

Tablas de Distribución de Frecuencias Las tablas de distribución de frecuencias, permiten organizar un conjunto de datos y resumirlos en frecuencias, de manera tal que se pueda visualizar la distribución de éstos; determinándose los valores de la distribución en donde se concentran o agrupa la mayor cantidad de observaciones, o  por el contrario, aquellos que tienen menor frecuencia. Se llama frecuencia absoluta o frecuencia, al conteo de las repeticiones de los datos, la que se ha de representar con fi . La frecuencia relativa ( fr ), corresponderá a la relación entre la frecuencia absoluta y el total de las frecuencias. Estas tablas de distribución, se pueden clasificar en Tablas de distribución de frecuencias y Tablas de distribución de frecuencias en datos agrupados. Veamos esto con un ejemplo, para diferenciarlas. En esta tabla la variable consumo de chocolates semanales, toma valores de 0 a 7, en una muestra de 122 individuos u observaciones, es decir, que el con