3. Análisis de la distribución espacial de los datos PDF

Title 3. Análisis de la distribución espacial de los datos
Pages 19
File Size 700.5 KB
File Type PDF
Total Downloads 265
Total Views 344

Summary

3. Análisis de la distribución espacial de los datos Una de las ventajas de la tecnología actual es la generación de datos, en este sentido, cada disciplina puede pensar en la mejor posibilidad de utilizarlos en función de sus propios problemas. Una de las tareas de la geografía se ha centrado en la...


Description

3. Análisis de la distribución espacial de los datos Una de las ventajas de la tecnología actual es la generación de datos, en este sentido, cada disciplina puede pensar en la mejor posibilidad de utilizarlos en función de sus propios problemas. Una de las tareas de la geografía se ha centrado en la localización, y principalmente, en la comprensión y explicación de determinados elementos sobre el espacio. Los geógrafos suelen enfrentarse a la posibilidad de localizar bajo unos objetivos ligados a la planeación u ordenamiento del espacio, dicha localización puede planteare en dos sentidos: uno, en cuanto al aprovechamiento de un recurso, por ejemplo, un lote baldío; y dos, en cuanto a la localización de un lugar cuya posición imparcial deba favorecer a muchos o aprovecharse al máximo, como ocurre con un puesto de salud o un centro educativo. La diferencia entre los dos radica en la importancia que se le da a la localización misma, lo que puede modificar las decisiones si se piensa en la relación que dicha localización puede tener con su entorno inmediato o más allá. Las medidas de resumen, como técnicas de análisis espacial, le otorgan al geógrafo la posibilidad de localizar con precisión y objetividad ciertos elementos a nivel espacial por medio del tratamiento estadístico de algunos datos. El presente capítulo no solo se centra en la obtención de estas medidas, sino en la espacialización gráfica de las mismas. Desde la Estadística se proponen tres formas de describir los datos, como un paso básico para su transformación en información; son estos: • Las representaciones gráficas • Las distribuciones de frecuencias • Las medidas de resumen

3.1 Las representaciones gráficas Diagramas y/o gráficos se constituyen en esquemas visuales, que muestran una o más ideas por medio de diferentes variables que son organizadas según reglas específicas que permiten acceder más fácil y didácticamente a la información. Bertin (1968) define los diagramas como “la construcción gráfica en que las correspondencias en un plano pueden establecerse entre todas las divisiones de una y otra componente que explican un fenómeno”. 1 Cabe agregar que, hablar de representaciones gráficas desde la geografía implica necesariamente incluir los mapas, puesto que en estos se hace posible la concretización de algunos 1

En los demás capítulos de este trabajo, se presentan algunas herramientas gráficas de gran utilidad.

fenómenos, mediante la espacialización de variables, que en ocasiones, no son fácilmente visibles en la realidad, pero que hacen parte de la dinámica y caracterización del espacio.

3.2 La distribución de frecuencias Es un método que utiliza tablas denominadas de distribución de frecuencias, con las que se busca ordenar los datos y describir el número de veces que ocurre un resultado dentro de un conjunto de observaciones. Según Carrera, et al (1993) “la distribución de frecuencias permite expresar con mayor claridad el grado de regularidad o irregularidad con que se distribuyen los diferentes valores que toma una variable”. Por su parte Harnett y Murphy (1987) resaltan la importancia de este tipo de distribución para hacer una “indicación más precisa de la información disponible”, contraria a las representaciones gráficas que “proporcionan una representación de la información y no de los datos en sí mismos”. El siguiente es un ejemplo de una tabla de distribución de frecuencias. Cuadro 3.1 Tabla de distribución de frecuencias

Viviendas Xi A B C D E

ni 5 8 3 2 4

Frecuencias Absolutas Ni 5 13 16 18 22

Frecuencias Relativas % fi Fi 23 23 36 59 14 73 9 82 18 100

La primera columna (xi) muestra la variable a distribuir, en este caso viviendas. La segunda columna (ni) muestra el número de veces en que ocurre un fenómeno; aquí presentamos el número de personas que habitan en cada una de las viviendas. La tercera columna (Ni) corresponde a la suma de una frecuencia absoluta con la adyacente en dirección descendente. La cuarta columna (fi) muestra el número de veces en que ocurre un fenómeno en relación con el total de observaciones, presentándose en porcentajes. La quinta columna (Fi) corresponde a la suma de una frecuencia relativa con la adyacente en dirección descendente.

3.3 Las medidas de resumen Son técnicas cuantitativas que permiten hacer una descripción general del conjunto de datos, a partir de la obtención de un sólo dato. De acuerdo a Harnett y Murphy (1987), el propósito es reducir la información a una medida simple. Este tipo de medidas son útiles para el análisis espacial en tanto hacen posible describir la distribución de un fenómeno geográfico en función de su concentración o su dispersión, lo que permite inferir que los datos implicados en este tipo de medidas tienen un carácter puntual. Las medidas de resumen se clasifican en dos grupos: • Las medidas de tendencia central: moda, mediana y media • Las medidas de dispersión: desviación típica, varianza y covarianza.

DATOS GEOGRÁFICOS

Las medidas de resumen proporcionan un tratamiento adecuado de los datos puesto que tienen en cuenta sus características temáticas y ante todo su componente espacial; en este sentido, los resultados arrojados por este tipo de medidas pueden reforzar la localización de un punto o, sugerir un nuevo emplazamiento para el mismo, haciendo un poco más objetiva la toma de decisiones, sin embargo cabe recordar que a pesar de la exactitud que estas medidas puedan tener, es el investigador quien utiliza tanto los métodos como los resultados, de acuerdo a sus requerimientos reales y a las posibilidades que proporciona el espacio. 3.3.1 Las medidas de tendencia central Son aquellas que se “caracterizan por sintetizar las posiciones de toda una estructura de localizaciones en un solo punto”. Son útiles especialmente para estudios evolutivos en los que “se analiza la posición de los puntos en diferentes etapas o en trabajos comparativos en los que se constatan dos o más fenómenos espaciales independientes”. (Gamir, et. al. 1995). La ventaja de éste tipo de medidas, tanto estadísticamente como espacialmente, es que no requieren un proceso matemático complejo. No obstante, la espacialización de algunos de sus resultados puede en ocasiones no corresponder con la realidad geográfica. 3.3.1.1 La Moda Es el valor que se repite el mayor número de veces dentro de un conjunto de datos. Para los siguientes datos: 34

5,7,3,2,8,4,1,6,5,3,8,3,5,7,2,4,3,4,6,2 La moda es 3

Es probable que en un conjunto de datos exista más de una moda. Por ejemplo en el siguiente conjunto de observaciones: 3,5,7,2,4,3,4,5,6,2,8,3,5,6,1,4,8,2,3,7,5 Los datos que más se repiten son 3 y 5, por lo tanto estos representan la moda.

En geográfia, cada dato corresponde a un emplazamiento. De acuerdo al tipo de escala que se desee utilizar, cada dato puede convertirse en un punto. La moda en este caso corresponderá con el área que contenga mayor densidad de puntos (datos). ¿Cómo se halla la moda en un conjunto de datos espacializados?

MADRID, A. & ORTÍZ, L.

Nuestro problema a solucionar es el siguiente: En la zona sur de la cabecera municipal de Gámeza, se busca emprender una campaña de salud, para lo cual se ha pensado en determinar cual es el área que tiene el mayor número de viviendas, para dar mayor cubrimiento en el menor tiempo posible. Se escoge una escala que cubra toda el área y que además permita que cada dato sea representado por un punto. En este caso hemos escogido la escala: 1:10.000 Se traza una cuadrícula sobre el área. El tamaño de la misma es decisión del investigador, sin embargo éste debe pensar en dos elementos básicos: la distancia a recorrer en función del problema y la posibilidad de encontrar un tamaño adecuado para la cuadrícula que responda eficazmente a una solución. En nuestro caso hemos utilizado dos tamaños diferentes de plantillas. Seguidamente procedemos a contar el número de puntos en cada uno de los cuadros para determinar el que tiene mayor densidad. Cuadro 3.2 Número de viviendas por cada uno de los cuadros de la plantilla

Cuadro No 1A 2A 3A 4A 5A 1B 2B 3B 4B 5B 1C 2C 3C 4C 5C 1D 2D 3D 4D 5D 1E 2E 3E 4E 5E

Número de viviendas 6 15 2 2 3 12 11 4 1 7 12 10 3 4 3 8 11 6 15 5 6 13 10 6 7

35

ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS

En la figura 3.1, tenemos 25 cuadros (4cm x 4cm), cada uno de ellos representa 1.600 m , pero encontramos que existen dos modas, las correspondientes a los cuadros 2A y 4D, que se encuentran bastante separados uno del otro y cada uno con 15 viviendas, lo cual probablemente dificultaría cumplir con el objetivo de la campaña que es hacer un mejor cubrimiento en el menor tiempo posible. Se opta, entonces por ampliar el tamaño de la cuadrícula; la figura 3.2 presenta áreas de 2.500 m2, el cuadro que tiene mayor densidad es el 2D, con 21 viviendas. 2

Cuadro 3.3 Número de viviendas por cada uno de los cuadros de la plantilla

36

Cuadro No. 1A 1B 1C 1D 2A 2B 2C 2D 3A 3B 3C 3D 4A 4B 4C 4D

Número de Viviendas 9 20 17 6 19 15 13 21 1 2 16 10 6 8 8 12

3.3.1.2 La mediana o centro mediano En términos estadísticos la mediana corresponde al dato que se ubica en todo el centro de las observaciones ordenadas, dejando la misma cantidad de datos a lado y lado de éste. En los siguientes datos: 1, 2, 6, 8, 8, 9, 10, 12, 13, 15, 16, 17, 20, 21, 21 La mediana corresponde al número 12.

Cuando el número de datos es par la mediana corresponde al valor medio entre los dos datos ubicados en el centro, así: 17, 18, 21, 23, 26, 27, 27, 27, 28, 30, 31, 31, 32, 34, 36, 36, 39, 40, 40, 42 La mediana es 30.5 como resultado de: 30 + 31 2

MADRID, A. & ORTÍZ, L.

En geografía, según Gamir, et. al. (1995) “el centro mediano de una estructura de puntos es aquella posición en la que se produzca una reparto equitativo de las observaciones puntuales en las direcciones N, S, E y O”. Es una medida “ideal” en tanto se busca la localización de un punto que sea relativamente equidistante a todos los demás puntos que lo rodean, sin embargo tal emplazamiento corre el riesgo de corresponder a un lugar que no obedezca a las especificaciones planteadas en el problema inicial, por ejemplo: una laguna, un río, una pendiente fuerte... ¿Cómo se halla la mediana en un conjunto de datos espacializados?

Continuando con el problema anterior, ahora se requiere ubicar un puesto promotor de salud que brinde los primeros auxilios, que esté pendiente de las remisiones y que capacite a la comunidad sobre infección respiratoria agua, enfermedad diarréica aguda, nutrición básica y cuidado de los niños en casa; este lugar, debe además funcionar como un centro de concentración temporal para algunos especialistas. El área de estudio en este caso, fue determinada a partir de la mayor concentración de viviendas que se estableció en el problema anterior. Se procedió a trazar un eje y a ubicar su centro, de tal forma que conservara la misma cantidad de viviendas en cada cuadrante (figura 3.3).

Fig. 3.3 Centro Mediano

39

ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS

Este procedimiento no implica operaciones de tipo matemático, basta desplazar los ejes hasta obtener el resultado deseado. En nuestro caso la distribución de los puntos sólo nos permitió una orientación de los ejes, pero es posible que para un mismo problema, dicha orientación señale varios centros medianos. El centro mediano, a diferencia del centro de gravedad, proporciona un resultado óptimo en términos prácticos, sin embargo, como afirma Ebdon (1982) “hay que limitar su uso a investigaciones geográficas preliminares, en las que cuenta más la rapidez que la precisión”. 3.3.1.3 La media aritmética o centro de gravedad La Media Aritmética es lo que la estadística denomina como el promedio. Consiste en la suma de los datos dividida en el número total de éstos. Esta medida depende considerablemente del valor que toma cada dato, es así como un sólo valor puede hacer desplazar la media hacia un punto y otro de las observaciones y no representar el fenómeno o la situación adecuada. En el siguiente conjunto de datos:

40

24, 36, 25, 19, 28, 31, 34, 22, 32 La media resulta al aplicar: X = Σx n X = 24 + 36 + 25 + 19 + 28 + 31 + 34 + 22 +32 9 X = 251 9 X = 27,8

Geográficamente, se habla de un centro de gravedad que incluye las dimensiones x e y, con la idea de ubicar la media aritmética de las localizaciones como tales y no del valor que éstas puedan tener. ¿Cómo se halla el centro de gravedad en un conjunto de datos espacializados?

2 En términos prácticos no resulta fácil manejar coordenadas geográficas, puesto que sus valores son mucho más altos, imprimiendo cierto grado de dificultad.

MADRID, A. & ORTÍZ, L.

Para aplicar este procedimiento al ejemplo anterior, procedemos a trazar un eje de coordenadas en la misma área de estudio. Para facilitar el trabajo, a cada punto se le asignó una letra (figura 3.4) y se determinaron sus posiciones, con lo cual obtuvimos los siguientes resultados (cuadro 3.4):

41

Figura 3.4 Centro de Gravedad Cuadro 3.4 Datos para hallas el centro de gravedad

Se aplicó la siguiente fórmula: x = Sx = 61,77 n 21

x = 2.94

y = Sy = 55.1 n 21

y = 2.62

Estos valores corresponden a un nuevo par de coordenadas que indican el centro de gravedad. Tal lugar podría ser el nuevo emplazamiento del centro de promotores de salud. Al compararlo con la medida anterior (mediana), observamos que la posición del centro de gravedad tuvo un desplazamiento hacia el occidente, que en distancia real corresponde aproximadamente a 10 metros.

ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS

Según Estébanez & Bradshaw (1978) el centro de gravedad tiene una serie de ventajas “puede resultar de utilidad para estudiar el cambio o la variación de una distribución a lo largo del tiempo”... “registra sensiblemente cualquier tipo de movimiento de los elementos de una población”. Sin embargo como desventaja esta medida “puede en algunos casos localizarse fuera del territorio estudiado”... “no indica ninguna característica de la región” y además “no resulta sencillo interpretar los resultados”. 3.3.1.4 El centro de gravedad ponderado Consiste en aplicar el mismo procedimiento del centro de gravedad, pero a cada uno de los puntos se le agrega un peso igual a un valor que es intrínseco a cada uno de los datos. ¿Cómo se halla el centro de gravedad ponderado?

42

Utilizando el mismo problema, hemos decidido tener en cuenta un nuevo valor que actuará como peso (w). Este valor corresponde al número de personas que habita en cada una de las viviendas del área, con el fin de identificar los puntos que representan mayor demanda del servicio de salud. Se obtuvieron los siguientes datos:

Cuadro 3.5 Datos para hallar el centro de gravedad ponderado

MADRID, A. & ORTÍZ, L.

Al localizar éste nuevo par de coordenadas (figura 3.5), observamos que en este caso el centro de gravedad ponderado no se trasladó notoriamente con relación al centro de gravedad.

Fig. 3.5 Centro de gravedad ponderado

Podría decirse que entre las tres medidas (mediana, centro de gravedad y centro de gravedad ponderado), la diferencia es aproximadamente de 10 metros entre una y otra. En términos reales y al hacer una observación del terreno se podría afirmar que cualquiera de los tres resultados sirve para ubicar el puesto de promotores de salud, puesto que topográficamente no presentan ningún inconveniente (figura 3.6)

Fig. 3.6 Diferencia espacial entre medidas

3.3.2 Las medidas de dispersión Son técnicas que analizan la disgregación de un conjunto de datos en relación con un centro medio. Espacialmente sirven para identificar qué tan distanciados y/o concentrados se encuentra cada uno de los puntos en relación con un centro de gravedad. Estas medidas superan, en parte, la dificultad de las medidas de tendencia central en las que los valores extremos modifican radicalmente los resultados; las medidas de dispersión toman todos los datos y buscan el grado de variabilidad o esparcimiento no sólo a un centro medio, sino al conjunto de datos puntuales.

43

ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS

3.3.2.1 Desviación típica Se define estadísticamente como “el grado de dispersión absoluta de los valores respecto a la media” (Gamir, et al. 1995). Para hallar la desviación típica se utiliza la siguiente fórmula:

en donde: s = desviación típica x = media de los valores de x n = número de observaciones En el siguiente conjunto de datos: 7, 5, 3, 4, 9, 1 x = 4,8 Ver Cuadro 3.6. Para obtener la desviación típica, se le resta a cada una de las observaciones la media (columna 2), cada uno de estos resultados se eleva al cuadrado (columna 3) con el propósito de evitar valores negativos, se suman y se dividen en el número de observaciones. Finalmente se obtiene la desviación típica hallando la raíz cuadrada de éste último resultado.

44

Cuadro 3.6 Datos para hallar la desviación típica

σ=2,6

En geografía, al igual que en las medidas de tendencia central, para hallar la desviación típica de un conjunto de datos puntuales espacializados, es necesario ubicarlos en el plano bidimensional x e y, y básicamente aplicar la misma fórmula estadística. La desviación típica puede obtenerse a partir de dos métodos: el gráfico y el aritmético. ¿Cómo se halla la desviación típica en un conjunto de datos espacializados?

3

Remitirse a dicho apartado.

MADRID, A. & ORTÍZ, L.

Nuestro problema a resolver es el siguiente: el puesto promotor de salud desea determinar cual es la distancia media que debe recorrer cualquiera de sus especialistas a cada una de las viviendas ubicadas en la zona escogida. Con ello desean determinar si en un solo día es posible realizar una campaña de vacunación, teniendo en cuenta el período de conservación de los antivirus a utilizar. Recordemos que el centro de gravedad es igual a: x = 2,94 y = 2,62 En la figura 3.7 aparecen señalados los trayectos de cada uno de los puntos hacia el centro de gravedad; es decir la distancia que existe entre cada vivienda y el centro promotor de salud.

Figura 3.7 Trayecto de cada uno de los puntos al centro de gravedad. Método gráfico

En el cuadro 3.7 se registran estas distancias en la columna 2, la columna 3 corresponde al cuadrado de las distancias.

σ=

61,49 21

σ=1,71

Cuadro 3.7 Longitud de cada uno de los trayectos al centro de gravedad

45

ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS

Al hacer el cálculo obtenemos una desviación típica de 1,71, que en términos reales equivale a 171 metros, lo que significa que esta es la distancia promedio que deben recorrer los especialistas desde el centro promotor de salud para prestar sus servicios. La desviación típica resultante, equivale gráficamente al radio de un círculo que encierra los puntos más cercanos al centro de gravedad, a partir de una distancia media, como se observa en la figura 3.8

Figura 3.8 Desviación típica de las distancias. Método gráfico

46

Debe tenerse en cuenta que en la vida real sería más pertinente establecer los trayectos a partir de las vías existentes, tanto fluviales como terrestres, puesto que no se estarían teniendo en cuenta los obstáculos físicos que pueden aparecer. No obstante, Estébanez & Bradshaw (1978) consideran que existen algunos hechos de carácter geográfico en los que se hace más recomendable el uso de la desviación típica, que el de algunas medidas de tendencia central. Los autores toman como ejemplo los estudios de funciones en los que el centro de gravedad se ubica por lo general en el centr...


Similar Free PDFs