Introducción
La Amazonía, ubicada en el norte del país, tiene diferentes poblaciones tropicales con una variedad de patrones y procesos forestales asociados a su gran diversidad (1). Al ser un bosque tropical, se estructura a través de un eje vertical que está formado por diferentes estratos vegetales, lo que permite clasificar el comportamiento de su estructura a través de la variación de altura, con el fin de obtener un mejor conocimiento del bosque. Estos estratos varían en altos, medios y bajos (2).
El conocimiento sobre los diferentes patrones de estructuras verticales que se encuentran en el bosque, es de suma importancia para la comprensión de las etapas sucesionales (bosque primario, secundario y clímax) (3), (4) que a través de la dinámica del bosque es posible entender la distribución que tienen las especies, cuáles son las especies que se pueden explorar, los individuos maduros que se pueden extraer, influyendo en las estrategias de conservación del bosque (5), (6). Con el avance de las tecnologías que brinda la ciencia de la computación, se pueden presentar alternativas de conocimiento de variables de importancia forestal, como los estratos vegetales, a través de herramientas de aprendizaje automático, que provienen de la inteligencia artificial, como las redes neuronales artificiales (RNA), un algoritmo que a través del aprendizaje inducido (7), se parece de una manera más simplificada al sistema de aprendizaje de redes biológicas (8).
La RNA tiene nodos, o neuronas, que están estructurados en capas, que se interconectan a través de una forma específica (9). Y se clasifican en tres capas: entrada, escondida y salida. Tiene un alto grado de confiabilidad, la herramienta computacional de RNA se ha implementado en la clasificación, debido a su adaptabilidad, aprendizaje y generalización de datos (10). Suponiendo que las redes neuronales artificiales son una herramienta más eficaz que los métodos manuales para la clasificación el objetivo del presente trabajo fue crear un modelo de red neuronal artificial para clasificar estratos forestales en un entorno llanura aluvial.
Materiales y métodos
Área de estudio: El área de estudio (Figura 1) se ubica en las coordenadas 0 ° 32'54.68''S y 51 ° 15'11.10''O, caracterizada por ser un bosque estuarino de llanura aluvial ubicado en el distrito de Itatupã, perteneciente al municipio de Gurupá, Pará, Brasil.
Figure 1. Location map of the study area.
Según el esquema de clasificación climática de Köppen, la ubicación se caracteriza por estar en la categoría "Ami", donde las precipitaciones durante los primeros seis meses del año son más abundantes, y en los otros meses esta precipitación disminuye a menos de 60 mm, y el valor medio anual es de 2100 mm, presentando una insolación total anual que oscila entre las 1800 y las 2200 horas. La temperatura promedio del lugar ronda los 31 ° C y la humedad relativa del aire es máxima del 90% y mínima del 30% (11). En cuanto al tipo de suelo de la zona, se clasifica como Gley, se presenta como hidromórfica por tratarse de una zona más húmeda con inundaciones constantes de las mareas, provocando que el suelo permanezca con exceso de agua y además de la marea para influir en la implementación de sedimentos al suelo que aumenta su fertilidad.
Recolección de datos: El inventario forestal se realizó en seis parcelas de 0,5 ha presentadas mediante muestreo sistemático, con criterio de inclusión CAP (circunferencia a la altura del pecho) ≥ 15 cm, en las cuales se midieron con ayuda de una cinta métrica y la altura con Hipsómetro Trupulser 360.
Para el análisis estructural vertical se utilizó la metodología (12), (13), que limita en tres estratos por la variabilidad de las alturas encontradas en el bosque. Estos estratos se definen en eqyacion 1, 2 y 3:
Donde: Hj es la altura total del árbol, é a média aritmética das alturas e Sh es la desviación estándar de la variable de altura.
Análisis de datos: Una neurona artificial se presenta matemáticamente, de acuerdo con ecuaciones 4 y 5:
Donde es la suma del producto de todas las neuronas interconectadas a la neurona k, es el peso en la conexión de la neurona m con k y es el valor de entrada de la neurona m.
Donde es el valor de salida de la neurona k, se obtiene multiplicando la función de activación (φ).
La estructura de la neurona artificial cambia según el algoritmo utilizado, que a su vez determina los pesos que generarán el valor de la variable de salida. El algoritmo de resilient propagation (Rprop) cambia estos pesos de manera más directa con base nos dados sobre o gradiente local, agregando un valor actualizado individualmente para cada peso (. Donde el algoritmo presenta una regla de aprendizaje basada en ecuación 6 y 7
Donde t es igual al tiempo y E es la tasa de aprendizaje.
Es decir, la tasa de aprendizaje aumenta o disminuye de acuerdo con la señal de la derivada, si esa señal no cambia, la tasa E aumenta, sin embargo, si esa señal cambia, la tasa E disminuye. En este estudio, se utilizaron dos tipos de algoritmo Rprop: Rprop + y Rprop-. Rprop- se caracteriza por permitir que el algoritmo salte el mínimo local innumerables veces, ya que el parámetro retrocede, inhibiendo la última iteración y proporcionando un valor más bajo para el parámetro (14), (15). Para la clasificación supervisada, los datos se dividieron en 70% para entrenamiento y 30% para pruebas. Los algoritmos se aplicaron utilizando el paquete de software neuralnet R (16), dando como resultado ocho modelos de redes neuronales artificiales del tipo multilayer perceptron (múltiples capas), con cuatro configuraciones de entradas (variables de entrada) (tabla 1) para cada algoritmo, tres neuronas en la capa media y las salidas (variables de salida) fueron los estratos: inferior, medio y superior.
El criterio de parada utilizado fue el estándar de función neuralnet donde el límite es 0,01 para las derivadas parciales de la función de error. La función de activación utilizada fue logística, o sigmoidea, la cual tiene la característica de ser binaria (Ecuación 8), es decir, asume valores entre 0 (implica no activación) y 1 (activación), su formulación matemática viene dada por:
Para obtener resultados imparciales, los modelos de RNA probados se evaluaron mediante una matriz de confusión, que expresa la correlación de los datos utilizados como base presentados como los valores reales con los datos clasificados (17), proporcionando luego el porcentaje de valores correctos y de error del clasificador (Ecuación 9 a 11).
Resultados y discusión
La relación de los estratos con las variables DAP (diámetro a la altura del pecho) y HT (altura total), se puede presentar a través del gráfico de caja de los datos, como se observa en la figura 2, donde se observa que el estrato medio es el único estrato que presenta pocas variaciones, mientras que los otros estratos mostraron mayores variaciones en relación a las variables, principalmente con la variable DAP, además de la presencia de outliers. Para la clasificación de los diferentes estratos se obtuvo:
Figure 2. Box plot of DBH and TH data in relation to strata.
Para el algoritmo Rprop + se obtuvieron cuatro modelos diferentes de redes neuronales artificiales, que obtuvieron valores en la fase de entrenamiento, como se muestra en la tabla 2. Se observa que los modelos A, B, D obtuvieron una constancia en los valores, ya que el modelo D presenta solo la variable HT en la capa de entrada, se demuestra que esta variable tiene mayor peso para el modelo, en contraste, el DAP es un variable menor para pesos. Las configuraciones finales de la red neuronal artificial (modelo D) se muestran en la figura 3, donde se presenta como la mejor RNA para el algoritmo.
Para el paso de prueba (tabla 3), para verificar el rendimiento real de los modelos. Tenga en cuenta que los modelos A, B y C fueron capaces de aprender verdaderamente el patrón de los estratos forestales, haciendo coincidir todos los datos. El modelo C, por otro lado, se desempeñó menos que en la etapa de entrenamiento.
Se obtuvieron cuatro modelos diferentes para el algoritmo Rprop-, presentados valores en la fase de entrenamiento, como se muestra en la tabla 4. Se observa que las configuraciones de entrada en los modelos E, F y H continúan presentando valores similares, comportamiento también presentado para el Rprop +, demostrando que la variable de mayor peso para el modelo es la variable cuantitativa altura, el modelo G presentó valores menores. La Figura 4 muestra las configuraciones finales de la mejor red neuronal artificial (modelo H) para el algoritmo estudiado.
Para los datos de la prueba, se observa que solo los modelos F y G obtuvieron el porcentaje total de aciertos, mientras que los modelos E y G obtuvieron valores más bajos que en la etapa de entrenamiento (tabla 5). Las diferencias entre los algoritmos estudiados son sutiles, ambos mostraron una velocidad satisfactoria en el tiempo de aprendizaje, además de una fácil aplicabilidad. Sin embargo, los modelos A, B y D de Rprop + presentaron los mejores rendimientos como clasificadores. En cuanto a la topología de las redes neuronales artificiales, se observa que el número de neuronas en la capa oculta obtuvo un desempeño satisfactorio en las mejores RNAs, en los que la cantidad se basó en el número de capas iniciales con todas las variables disponibles. No existe un criterio establecido para el número óptimo, sin embargo, este valor puede influir directamente en el rendimiento de la RNA, como se indica (18).
La función de activación sigmoidea es la más utilizada en estudios que utilizan RNA en ciencias forestales (19), (20), (21), por tanto, este estudio corrobora la demostración del desempeño de esta función para resultados satisfactorios, tanto con un algoritmo que involucra variables cuantitativas como cualitativas para datos de importancia forestal. Dirigiendo a la actualización de los pesos, ya que los pesos se actualizaron de forma aleatoria mediante el software utilizado, se observa que en su formulación de RPROP- saltar mínimos globales no ofreció un buen aprendizaje para las redes neuronales probadas.
En general, el alto desempeño de la red neuronal artificial como modelo clasificador puede explicarse por su mayor característica, que es el aprendizaje a través de ejemplos, de manera que generalice la información que ha aprendido, efectuando la generación de un modelo (22), luego logrando clasificar los datos con mayor precisión. También hay resultados satisfactorios de las RNAs para clasificar los estratos forestales en el estudio de (23), en el que demostró su eficacia con datos recopilados por teledetección. La inteligencia artificial en sí misma es una herramienta fundamental para mejorar los pequeños procesos en el sector forestal, especialmente porque es un recurso renovable a largo plazo con una variedad de biodiversidad, así, este estudio demuestra que un algoritmo de supervisión es capaz de proporcionar estratos forestales de forma más optimizada y con mayor precisión con datos de un bosque nativo.
En el cual estos datos pueden ser utilizados para una planificación forestal más adecuada, ayudando a tomar decisiones más precisas, así como a la aplicación de actividades silvícolas o un plan sustentable orientado a la tala (24). Además de otros procesos que tiene el aprendizaje automático, especialmente las RNAs, se ha venido demostrando principalmente en la estimación de variables difíciles de recolectar, como la altura, una variable clave para el conocimiento de la estratificación forestal, como lo presentan (25), (26), (27), (28). Se demostró entonces la colaboración de esta rama de la ciencia da la computación en las ciencias forestales.
Figure 3. Artificial neural network models of the algorithm for Rprop+.
Figure 4. Artificial neural network models of the algorithm for Rprop-.
Conclusiones
Los modelos de redes neuronales artificiales con el modelo del algoritmo de propagación resiliente en su configuración RPROP + mostraron alta precisión como clasificadores de estratos forestales en un entorno de llanura aluvial, con una alta tasa de aprendizaje, confiabilidad y generalización de datos. La variable altura total (HT) presentó mayor peso para la red neuronal, debido a que el estrato es dependiente de esta variable cuantitativa.