Publicada por la Sociedad Española de la Ciencia del Suelo
Volumen 8. Abril 2001. pág 41-49.
MÉTODOS DE OPTIMIZACIÓN DE MUESTREO EN LOS ESTUDIOS DE LAS PROPIEDADES FÍSICAS DEL SUELO.
A. M. MONTIEL TORRES 1 y R. BLANCO SEPÚLVEDA 2
1 Departamento de Estadística y Econometría. Facultad de Ciencias Económicas. Universidad de Málaga.
2 Departamento de Geografía. Universidad de Málaga.
Todos los autores coinciden en señalar que las propiedades del suelo, tanto físicas como químicas, se caracterizan por una gran variabilidad (Cline, 1944; Youngs, 1983; Briggs y Shishira, 1985; Vallejo et al., 1993; Martínez, 1996).
En el caso concreto de las propiedades físicas, la heterogeneidad de resultados es debido a toda una serie de factores que inciden sobre la superficie del suelo (Youngs, 1983): presencia de grietas estructurales, presencia de materiales de distinta naturaleza, diferentes procesos de edafogénesis, actividad de los animales, alteraciones provocadas por el hombre, etc. Esta situación complica la estimación de los parámetros de la población, ya que para conocerlos no basta con tomar una muestra de la unidad espacial objeto de estudio sino que se deberá recoger un número de muestras adecuado que represente de forma fiable a la población.
En la práctica, el análisis de los parámetros poblacionales se hace preferentemente mediante muestreo, del cual, si se ha escogido la muestra de forma adecuada, se puede extraer una información similar a la de la población, con la ventaja del menor coste económico y temporal (Rodríguez, 1993; Peña, 1995), teniendo en cuenta que, el conocimiento de una población, salvo excepciones, no se puede conseguir con toda exactitud mediante una muestra (Barbancho, 1980). Con este objetivo se va a calcular el tamaño muestral a partir de una serie de estrategias de optimización del muestreo.
Escenario de trabajo.
El espacio donde se ha llevado a cabo la investigación es una explotación ganadera situada en los Montes de Málaga. La cartografía de unidades homogéneas, realizado previamente mediante muestreo estratificado, ha permitido obtener una serie de unidades ambientales con las mismas características (Blanco, 2000). El objetivo ha sido reducir al máximo la variabilidad de resultados inherente a los factores ambientales.
La unidad muestral elegida tiene una superficie de 250 m2 y se caracteriza por una pendiente del 45%, una orientación NE, una litología compuesta por filitas paleozoicas del zócalo maláguide y una asociación de suelos compuesta por regosoles lépticos y eútricos y leptosoles eútricos con inclusiones de cambisoles léptico-crómicos y crómico-eútricos. Es una zona sometida a un uso ganadero en régimen extensivo, caracterizado por una carga ganadera real acumulada elevada y una frecuencia de pastoreo anual muy elevada. Dicha unidad se ha dividido en 10 parcelas de 25 m2, tomándose de cada una de ellas 2 muestras a una profundidad de 5 cm. a partir de la superficie, lo que resulta un tamaño muestral de n = 20.
Parámetros y métodos de análisis.
a) Densidad aparente. Método del cilindro (Henin et al., 1976; Guitián y Carballas, 1976; Blake y Hartge, 1986).
b) Porosidad. Se calcula mediante la relación entre el volumen de poros y el volumen total del suelo.
c) Estabilidad estructural. Índice de inestabilidad estructural de Henin et al. (1976).
d) Capacidad de retención de agua en el suelo a la capacidad de campo. Método de Cassel y Nielsen, 1986.
e) Capacidad de infiltración. Método del infiltrómetro de cilindro simple con carga constante (Amerman, 1983; Bouwer, 1986; Youngs, 1987, 1991).
Métodos estadísticos de optimización del muestreo. Cálculo del tamaño muestral.
Las técnicas que se han utilizado para analizar la variabilidad de las propiedades del suelo y han servido para diseñar una estrategia de muestreo adecuada, con el objetivo de determinar el tamaño de la muestra, son las siguientes:
a) Cálculo del tamaño muestral para poblaciones infinitas y con una distribución normal a partir de la fórmula deducida para los intervalos de confianza.
b) Representación gráfica de la varianza corregida y el error de muestreo para un intervalo de confianza del 95% con un número creciente de muestras (n = 2 ... 20).
Una vez obtenidos los resultados de la aplicación de ambas técnicas se escoge el tamaño muestral más ajustado.
El tamaño muestral, calculado a partir de la fórmula deducida para los intervalos de confianza, permite estimar la media en los muestreos de tipo aleatorio simple y para poblaciones infinitas. La fórmula, a nivel teórico, ha sido analizada por numerosos autores (Rodríguez, 1993; Peña, 1995). Esta toma la siguiente expresión:
Con esta fórmula se obtiene el número mínimo de muestras necesarias para determinar el valor medio de una propiedad.
Bruce y Luxmoore (1986) sugieren que esta estimación debe hacerse para un intervalo de confianza del 95% y un error de muestreo para la estimación de la media poblacional igual o inferior al 10% del valor de la media muestral.
La fórmula se ha utilizado en muchos trabajos sobre variabilidad y diseño de muestreos (Cline, 1944; Llorca, 1991; Brubaker y Hallmark, 1991; Burrough, 1991; Vallejo et al., 1993; Martínez, 1996); sin embargo, parte de estos autores coinciden al señalar que la utilidad práctica de la fórmula es reducida (Vallejo et al., 1993; Martínez, 1996) debido a que suministra, en todos los casos, un número teórico y, además, el tamaño de muestreo que resulta para estudiar numerosas propiedades es tan elevado que es inviable su aplicación, sobre todo, cuando se utilizan técnicas destructivas. Sin embargo, éste puede tener gran utilidad cuando previamente al muestreo se ha dividido el territorio en unidades homogéneas, de ahí que, en algunos de los casos analizados, como se verá más adelante, se obtienen valores que se ajustan muy bien a las posibilidades reales de muestreo,
Antes de seguir hay que tener en cuenta que esta fórmula sólo se puede aplicar a muestras con distribución normal (Burrough, 1991). En este caso todos los parámetros medidos cumplen el requisito de normalidad en su distribución, a excepción de la capacidad de infiltración (Martínez, 1996), lo que motiva que sea necesario el uso de otras técnicas para estimar el tamaño muestral.
Las medidas de dispersión son las técnicas clásicas de análisis de la variabilidad de las propiedades del suelo. Su utilidad descriptiva se pone de manifiesto en numerosos trabajos (Alcala y Monturiol, 1988; Vallejo et al., 1993). Los parámetros que usualmente miden la variabilidad son la varianza, la desviación típica y el coeficiente de variación. Estos se suelen utilizar en la optimización del muestreo representando gráficamente los resultados con un número creciente de muestras, con el objetivo de detectar el punto a partir del cual se estabiliza la variación. Ese punto de estabilización de la curva se puede considerar que representa el número de muestras que se deben tomar para estimar el parámetro poblacional en cuestión. En este caso se ha utilizado la representación gráfica de la varianza corregida, sometiéndose, además, a la misma representación gráfica al error de muestreo para un nivel de confianza del 95%.
Para establecer el tamaño muestral mediante estas técnicas se ha utilizado como criterio el punto a partir del cual el rango entre los valores de varianza o, en su caso, los errores de muestreo se reducen considerablemente o bien se estabilizan. En ciertos casos, como en la densidad aparente, no ha sido necesario acudir al rango ya que el punto de inflexión de la curva lo han marcado los propios valores de varianza y error de muestreo.
Para Rodríguez (1993) es imprescindible añadir a cada estimación su grado de precisión para poder determinar, de esta forma, cuál es su aproximación a la realidad y, por tanto, la confianza que merece. Por lo tanto, una vez obtenidos los resultados del muestreo de campo y del trabajo de laboratorio, se ha realizado la inferencia estadística, mediante la cual se pretende conocer los resultados del muestreo y su precisión. La inferencia estadística se enfoca, tradicionalmente, utilizando la teoría de la estimación, la cual se desarrolla utilizando las técnicas de estimación por puntos y por intervalos.
La estimación por puntos de las características de la población se estiman, cuando sólo se dispone de una muestra, utilizando la media y la varianza corregida de la misma. En el caso de que los estimadores tiendan a seguir distribuciones normales, las expresiones que se utilizan son las siguientes:
Cuando se desconoce la media poblacional resulta imposible calcular la varianza de la población (s2). Por ello, ésta se sustituye por la varianza muestral (s2) (Rodríguez, 1993). En lugar de la varianza se va a utilizar la desviación típica muestral (s), lo que equivale a la raíz cuadrada de la varianza. En este sentido resulta todavía más conveniente utilizar en lugar de la desviación típica muestral, el mejor estimador o estimador más eficiente de la desviación típica o desviación típica muestral corregida (Í), siempre y cuando el tamaño de la muestra no pase de 30 (Estébanez y Bradshaw, 1979). Al introducir en la fórmula el divisor n-1 se obtienen mejores cualidades como estimador, debido a que es el estimador insesgado.
El error de muestreo para la estimación de la media muestral en el supuesto que se utilice un muestreo aleatorio simple y para una población infinita, toma la siguiente expresión:
En los casos citados y con el objetivo de calcular la estimación por intervalos se sustituye la distribución normal (Z) por la distribución “t de Student” (t) debido a que desconocemos la varianza poblacional (Peña, 1995). Igualmente, Estébanez y Bradshaw (1979) argumentan que, para estimar los límites de confianza, en los casos en los que el tamaño muestral sea inferior a 30, se debe utilizar la distribución “t de Student”.
Los límites de confianza vienen definidos por la siguiente expresión:
La precisión de las estimaciones se han calculado para un nivel de confianza del 95%, es decir la probabilidad de inferencia de la población a través de la muestra es del 95%.
Los resultados obtenidos de la aplicación de las técnicas de inferencia estadística y del cálculo del tamaño muestral, se representan en la Tabla 1.
Se ha realizado para cada muestra analizada el test de rachas de la mediana (Peña, 1995) con el objetivo de comprobar la aleatoriedad de las muestras, resultando ser, en todos los casos, aleatorias y, por tanto, válidas.
La densidad aparente. Esta propiedad se caracteriza por una escasa variabilidad intrínseca, lo que pone de manifiesto el coeficiente de variación del 7,95% para una muestra de tamaño n=20. Para este tamaño muestral existe un error de muestreo para la media poblacional de 0,05 g/cm3. Los límites de confianza de la media poblacional para una probabilidad del 95% se encuentra entre 1,50 y 1,40 g/cm3.
El tamaño de la muestra con un nivel confianza del 95% y un error de estimación 10% obtenido por la fórmula de los diseños de muestreo, es de n = 3.
La varianza corregida oscila entre valores con muy poco recorrido por lo que su representación gráfica con un número creciente de muestras no resulta significativa para la optimización del muestreo (gráfico 1). Por el contrario, mediante la representación gráfica del error de muestreo se obtiene una curva muy significativa (gráfico 2), ya que se observa una reducción progresiva del error de la estimación a medida que aumenta el número de ensayos. Los valores del error bajan de 0,1 a partir de un tamaño muestral n = 6, estabilizándose los errores en torno a 0,07 desde n =12 hasta n = 20.
De los resultados obtenidos de la aplicación de ambas técnicas se escoge el tamaño muestral de 3 ensayos porque es el más ajustado de todos.
La porosidad. El coeficiente de variación indica que la distribución de 20 muestras es moderadamente variable, con un valor que se eleva al 18,7%. Para este tamaño muestral existe un error de muestreo para la media poblacional del 3,2%. Los límites de confianza de la media poblacional para una probabilidad del 95% se encuentran entre el 39,88 y el 33,47%.
La estimación del tamaño de la muestra con un nivel de confianza del 95% y un error de estimación 10%, obtenida a partir de la fórmula de los diseños de muestreo es de n = 15.
La representación gráfica de la varianza corregida es, en este caso, muy significativa (gráfico 3). Resulta una muestra de tamaño n = 9, que es cuando el rango de la varianza se estabiliza entre 4 y 5. El error de muestreo también presenta una tendencia significativa (gráfico 4).
El tamaño muestral es de 7 ensayos si se considera como punto de inflexión el momento en el que el rango del error baja de 1 y se estabiliza.
De los resultados obtenidos se escoge el tamaño muestral de 7 ensayos porque es el más ajustado.
La capacidad de retención de agua a capacidad de campo. El coeficiente de variación de la distribución de 20 muestras es moderadamente variable, con un valor que se eleva al 12,48%. Para este tamaño muestral existe un error de muestreo para la media poblacional del 1,23%. Los límites de confianza de la media poblacional para una probabilidad del 95% se encuentran entre el 23,80 y el 21,33%.
La estimación del tamaño de la muestra con un nivel de confianza del 95% y un error de la estimación 10%, obtenida a partir de la fórmula de los diseños de muestreo es de n = 7.
La representación gráfica de la varianza corregida es, en este caso, muy significativa (gráfico 5). Resulta una muestra de tamaño n = 7, que es cuando el recorrido entre los valores se estabiliza. El estudio del error de muestreo también muestra una tendencia significativa (gráfico 6). El recorrido entre los valores se estabiliza en torno a 0,2 con un tamaño muestral de n = 8 ensayos.
De los resultados obtenidos se escoge el tamaño muestral de 7 ensayos porque es el más ajustado.
La capacidad de infiltración. El coeficiente de variación indica que la distribución de 20 muestras es moderadamente variable, con un valor que se eleva al 14,87%. Para este tamaño muestral existe un error de muestreo para la media poblacional de 4,57 cm/h. Los límites de confianza de la media poblacional, para una probabilidad del 95%, se encuentren entre 74,77 y 65,62 cm/h.
Los resultados obtenidos con la representación gráfica de la varianza corregida no resultan adecuados ya que la tendencia de la curva no satisface los objetivos marcados (gráfico 7).
Por el contrario, el error de muestreo es el que ofrece la mejor tendencia como método de optimización del muestreo. El recorrido entre los errores de muestreo se estabiliza en torno a 1 a partir del tamaño muestral n=6 (gráfico 8).
La inestabilidad estructural. El coeficiente de variación indica que la distribución de 20 muestras es muy variable, con un valor que se eleva al 46,66%. Para este tamaño muestral existe un error de muestreo para la media poblacional de 0,32. Los límites de confianza de la media poblacional para una probabilidad del 95% se encuentran entre 1,80 y 1,15.
La estimación del tamaño de la muestra con un nivel de confianza del 95% y un error de estimación 10%, obtenida a partir de la fórmula de los diseños de muestreo es desproporcionada ya que asciende a n = 95.
La representación gráfica de la varianza corregida es, en este caso, muy significativa (gráfico 9). El rango entre las varianzas se estabiliza cuando baja de 0,1, lo que ocurre a partir de una muestra de tamaño n = 8.
Los mismos resultados se han obtenido con el estudio del error de muestreo (gráfico 10), es decir, el rango entre los errores se ha estabilizado en torno a 0,1, lo que se ha producido a partir de una muestra de tamaño n = 8.
De los resultados obtenidos se escoge el tamaño muestral de 8 ensayos porque es el más ajustado.
Los resultados obtenidos a partir de la fórmula deducida para los intervalos de confianza, refiriéndose concretamente a la densidad aparente y a la capacidad de campo, se ajustan muy bien a las posibilidades reales de muestreo. En este sentido hay que valorar positivamente que, como paso previo al muestreo, se ha distribuido a la población en unidades homogéneas, lo que ha reducido la variabilidad intrínseca de las propiedades del suelo medidas.
La representación gráfica de la varianza corregida ha tenido en los casos concretos de la densidad aparente y la capacidad de infiltración una escasa utilidad como técnica de optimización del muestreo; mientras que, en el resto la tendencia de la curva ha sido adecuada para los objetivos marcados.
Por último hay que destacar que, pese a que la representación gráfica del error de muestreo es una técnica poco usual en los estudios sobre variabilidad, sin embargo, los resultados obtenidos han sido muy satisfactorios, poniendo de manifiesto, por tanto, importantes aplicaciones prácticas en la determinación del tamaño muestral.
REFERENCIAS
Amerman, C.R. (1983): “Infiltration measurement” En Proc. Conf. On Advances in Infiltration, Chicago. ASAE Publication, 11-83: 201-214.
Barbancho, A. (1980): Estadística elemental moderna. Ed. Ariel, Barcelona.
Blake, G.R. y Hartge, K.H. (1986): “Bulk density”. Methods of Soil Analysis. Part I. Physical and Mineralogical Methods. Second Edition. Madison. Wisconsin, USA, 363-375.
Blanco, R. (2000): Propuesta metodológica para la aplicación del análisis de las propiedades físicas edáficas a la evaluación del suelo para usos ganaderos. Tesis Doctoral. Universidad de Málaga. Inédito.
Bouwer, H. (1986): “Intake rate: cylinder infiltrometer”. PAGE, A.L.; MILLER, R.H. y KEENEY, D.R. (ed.): Methods of Soil Analysis. Part I. Physical and Mineralogical Methods. Second Edition. Agronomy 9. Madison. Wisconsin, USA, 825-844.
Briggs, D.J. y Shishira, E.K. (1985): “Soil variability in geomorphologically defined survey units in the Albudeite area of Murcia province, Spain”. Catena Suppl., 6, 69-84.
Brubaker, S.C. y Hallmar, C.T. (1991): “A comparison of statistical methods for evaluating map unit composition”. MAUSBACH, M. y WILDING, L. (ed.): Spatial variability of soils and landforms. ASA-CSSA-SSSA, 8: 73-88.
Bruce, R.R. y Luxmoore, R.J. (1986): “Water retention: field methods”. Methods of Soil Analysis. Part I. Physical and Mineralogical Methods. Second Edition. Agronomy 9. Madison. Wisconsin, USA, 663-686.
Burrough, P.A. (1991): “Sampling designs for quantifying map unit composition”. MAUSBACH, M. y WILDING, L. (ed.): Spatial variability of soils and landforms. ASA-CSSA-SSSA, 8: 89-125.
Cassel, D.K. y Nielsen, D.R. (1986): “Field capacity and available water capacity”. Methods of Soil Analysis. Part I. Physical and Mineralogical Methods. Second Edition. Madison. Wisconsin, USA, 901-926.
Cline, M.G. (1944): Principles of soil sampling. Soil Science, 58, 275-288.
Estébanez, J. y Bradshaw, R.P. (1979): Técnicas de cuantificación en Geografía. Ed. Tebar Flores. Madrid.
Guitián, F. y Carballas, T. (1976): Técnicas de análisis de suelos. Ed. Pico Sacro, Santiago de Compostela.
Henin, S.; Gras, R. y Monnier, G. (1976): El perfil cultural. Mundi-Prensa, Madrid.
Llorca, R. (1991): Prácticas de edafología. Univ. Politécnica de Valencia.
Martínez, J. (1996): Variabilidad espacial de las propiedades físicas e hídricas de los suelos en medio semiárido mediterráneo. Cuenca de la Rambla de Perea (Murcia). Univ. de Murcia.
Peña, D. (1995): Estadística. Modelos y métodos.1. Fundamentos. Alianza Universidad Textos. Madrid.
Rodríguez, J. (1993): Métodos de muestreo. CIS, colección Cuadernos Metodológicos, 1. Madrid.
Vallejo, V.R.; Cortina, J.; Fons, J.; Romanya, J. y Sauras, T. (1993): Estrategias de muestreo en suelos forestales. El estudio del suelo y de su degradación en relación con la desertificación. MAPA. SECS. Salamanca, 1717-1726.
Youngs, E.G. (1983): Soil physical theory and heterogeneity. Agr. Water Management, 6, 145-159.
Youngs, E.G. (1987): Estimating hydraulic conductivity values from ring infiltrometer measurements. J. Soil Sci., 38, 623-632.
Young, E.G. (1991): Infiltration measurements. A review. Hidrological processes, 5, 309-320.
Página Principal | Presentación EDAFOLOGIA | Indice vol. 8 | Principio página