SciELO - Scientific Electronic Library Online

 
vol.19 issue45Quantification of social, economic and ecosystem indicators that allow to evaluate sustainability in managed forestsGeostatistical modeling and remotely sensed data to improve dendrometric variables prediction in Tectona grandis L. f. stand author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista Forestal Mesoamericana Kurú

On-line version ISSN 2215-2504

Kurú vol.19 n.45 Cartago Jul./Dec. 2022

http://dx.doi.org/10.18845/rfmk.v19i45.6326 

Artículo

Modelo de clasificación en diferentes estratos forestales en un entorno de llanura aluvial utilizando redes neuronales artificiales

Classification model in different forest strata in a floodplain environment using artificial neural networks

Anthoinny Vittória dos Santos Silva 1  

Rodrigo Galvão Teixeira de Souza 2  

Gabriel Victor Caetano Carvalho Liarte 2  

Bianca Caterine Piedade Pinho 3  

Cinthia Pereira de Oliveira 2  

Duberlí Geomar Elera Gonzáles 4  

Robson Borges de Lima 2  

Jadson Coelho de Abreu 2  

1. Departamento de Engenharia Florestal, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, Minas Gerais, Brasil. vittoria.sntsilva@gmail.com

2. Laboratório de Manejo Florestal, Universidade do estado do Amapá, Macapá, Amapá, Brasil. rodrigosouza55@hotmail.com, gabriel.liarte1@gmail.com, cinthia.florestal@gmail.com, robson.lima@ueap.edu.br, jadson.abreu@ueap.edu.br

3. Instituto Federal do Pará, Parauapebas, Pará, Brasil. bianca.pinho@ifpa.edu.br

4. Escuela Profesional de Ingeniería Forestal y Ambiental, Universidad Nacional Autónoma de Chota, Cajamarca, Perú. duberelera@gmail.com

Resumen

La selva amazónica presenta diferentes estratos forestales, debido a su estructura heterogénea. En el que estos estratos pueden variar en altos, medios y bajos. El conocimiento de los diferentes patrones de estructuras verticales que se encuentran en el bosque es extremadamente importante para comprender la dinámica de la vegetación, lo que influye en las estrategias de conservación del bosque. Con el fin de optimizar el proceso de clasificación de los diferentes tipos de estratos, el objetivo del presente trabajo fue utilizar redes neuronales artificiales (RNA) para clasificar estos estratos. Se utilizaron dos algoritmos de resilient propagation (Rprop+ y Rprop-), en cuatro configuraciones diferentes de variables de entrada. El entrenamiento y la prueba de los ocho modelos de RNAs se realizaron utilizando el software R. Los modelos se evaluaron mediante una matriz de confusión. En qué modelos con entradas: HT, DAP y QF; HT, DAP y solo HT del algoritmo Rprop + obtuvieron 100% de aciertos en la clasificación de estrato, presentando una alta tasa de aprendizaje, confiabilidad y generalización de datos.

Palabras clave: Aprendizaje automático; estratificación; resilient propagation.

Abstract

The Amazon forest presents different forest strata, due to its heterogeneous structure. In which these strata can vary in upper, middle and lower. Knowledge about the different patterns of vertical structures found in the forest is extremely important for understanding the vegetation dynamics, influencing forest conservation strategies. In order to optimize the process of classifying the different types of strata, the objective of the present work was to use artificial neural networks (ANNs) to classify these strata. Two resilient propagation algorithms (Rprop + and Rprop-) were used, in four different configurations of input variables. The training and testing of the eight RNA models were performed using the R software. The models were evaluated using a confusion matrix. In which models with inputs: HT, DAP and QF; HT, DAP and only HT from the Rprop + algorithm obtained 100% correct answers in the classification of strata. Demonstrating a high rate of learning, reliability and generalization of data.

Keywords: Machine learning; resilient propagation; stratification

Introducción

La Amazonía, ubicada en el norte del país, tiene diferentes poblaciones tropicales con una variedad de patrones y procesos forestales asociados a su gran diversidad (1). Al ser un bosque tropical, se estructura a través de un eje vertical que está formado por diferentes estratos vegetales, lo que permite clasificar el comportamiento de su estructura a través de la variación de altura, con el fin de obtener un mejor conocimiento del bosque. Estos estratos varían en altos, medios y bajos (2).

El conocimiento sobre los diferentes patrones de estructuras verticales que se encuentran en el bosque, es de suma importancia para la comprensión de las etapas sucesionales (bosque primario, secundario y clímax) (3), (4) que a través de la dinámica del bosque es posible entender la distribución que tienen las especies, cuáles son las especies que se pueden explorar, los individuos maduros que se pueden extraer, influyendo en las estrategias de conservación del bosque (5), (6). Con el avance de las tecnologías que brinda la ciencia de la computación, se pueden presentar alternativas de conocimiento de variables de importancia forestal, como los estratos vegetales, a través de herramientas de aprendizaje automático, que provienen de la inteligencia artificial, como las redes neuronales artificiales (RNA), un algoritmo que a través del aprendizaje inducido (7), se parece de una manera más simplificada al sistema de aprendizaje de redes biológicas (8).

La RNA tiene nodos, o neuronas, que están estructurados en capas, que se interconectan a través de una forma específica (9). Y se clasifican en tres capas: entrada, escondida y salida. Tiene un alto grado de confiabilidad, la herramienta computacional de RNA se ha implementado en la clasificación, debido a su adaptabilidad, aprendizaje y generalización de datos (10). Suponiendo que las redes neuronales artificiales son una herramienta más eficaz que los métodos manuales para la clasificación el objetivo del presente trabajo fue crear un modelo de red neuronal artificial para clasificar estratos forestales en un entorno llanura aluvial.

Materiales y métodos

Área de estudio: El área de estudio (Figura 1) se ubica en las coordenadas 0 ° 32'54.68''S y 51 ° 15'11.10''O, caracterizada por ser un bosque estuarino de llanura aluvial ubicado en el distrito de Itatupã, perteneciente al municipio de Gurupá, Pará, Brasil.

Figura 1 Mapa de ubicación del área de estudio.  

Figure 1. Location map of the study area.

Según el esquema de clasificación climática de Köppen, la ubicación se caracteriza por estar en la categoría "Ami", donde las precipitaciones durante los primeros seis meses del año son más abundantes, y en los otros meses esta precipitación disminuye a menos de 60 mm, y el valor medio anual es de 2100 mm, presentando una insolación total anual que oscila entre las 1800 y las 2200 horas. La temperatura promedio del lugar ronda los 31 ° C y la humedad relativa del aire es máxima del 90% y mínima del 30% (11). En cuanto al tipo de suelo de la zona, se clasifica como Gley, se presenta como hidromórfica por tratarse de una zona más húmeda con inundaciones constantes de las mareas, provocando que el suelo permanezca con exceso de agua y además de la marea para influir en la implementación de sedimentos al suelo que aumenta su fertilidad.

Recolección de datos: El inventario forestal se realizó en seis parcelas de 0,5 ha presentadas mediante muestreo sistemático, con criterio de inclusión CAP (circunferencia a la altura del pecho) ≥ 15 cm, en las cuales se midieron con ayuda de una cinta métrica y la altura con Hipsómetro Trupulser 360.

Para el análisis estructural vertical se utilizó la metodología (12), (13), que limita en tres estratos por la variabilidad de las alturas encontradas en el bosque. Estos estratos se definen en eqyacion 1, 2 y 3:

Donde: Hj es la altura total del árbol, é a média aritmética das alturas e Sh es la desviación estándar de la variable de altura.

Análisis de datos: Una neurona artificial se presenta matemáticamente, de acuerdo con ecuaciones 4 y 5:

Donde es la suma del producto de todas las neuronas interconectadas a la neurona k, es el peso en la conexión de la neurona m con k y es el valor de entrada de la neurona m.

Donde es el valor de salida de la neurona k, se obtiene multiplicando la función de activación (φ).

La estructura de la neurona artificial cambia según el algoritmo utilizado, que a su vez determina los pesos que generarán el valor de la variable de salida. El algoritmo de resilient propagation (Rprop) cambia estos pesos de manera más directa con base nos dados sobre o gradiente local, agregando un valor actualizado individualmente para cada peso (. Donde el algoritmo presenta una regla de aprendizaje basada en ecuación 6 y 7

Donde t es igual al tiempo y E es la tasa de aprendizaje.

Es decir, la tasa de aprendizaje aumenta o disminuye de acuerdo con la señal de la derivada, si esa señal no cambia, la tasa E aumenta, sin embargo, si esa señal cambia, la tasa E disminuye. En este estudio, se utilizaron dos tipos de algoritmo Rprop: Rprop + y Rprop-. Rprop- se caracteriza por permitir que el algoritmo salte el mínimo local innumerables veces, ya que el parámetro retrocede, inhibiendo la última iteración y proporcionando un valor más bajo para el parámetro (14), (15). Para la clasificación supervisada, los datos se dividieron en 70% para entrenamiento y 30% para pruebas. Los algoritmos se aplicaron utilizando el paquete de software neuralnet R (16), dando como resultado ocho modelos de redes neuronales artificiales del tipo multilayer perceptron (múltiples capas), con cuatro configuraciones de entradas (variables de entrada) (tabla 1) para cada algoritmo, tres neuronas en la capa media y las salidas (variables de salida) fueron los estratos: inferior, medio y superior.

Cuadro 1 Diferentes configuraciones de variables de entrada de los modelos de redes neuronales artificiales probados.  

El criterio de parada utilizado fue el estándar de función neuralnet donde el límite es 0,01 para las derivadas parciales de la función de error. La función de activación utilizada fue logística, o sigmoidea, la cual tiene la característica de ser binaria (Ecuación 8), es decir, asume valores entre 0 (implica no activación) y 1 (activación), su formulación matemática viene dada por:

Para obtener resultados imparciales, los modelos de RNA probados se evaluaron mediante una matriz de confusión, que expresa la correlación de los datos utilizados como base presentados como los valores reales con los datos clasificados (17), proporcionando luego el porcentaje de valores correctos y de error del clasificador (Ecuación 9 a 11).

Resultados y discusión

La relación de los estratos con las variables DAP (diámetro a la altura del pecho) y HT (altura total), se puede presentar a través del gráfico de caja de los datos, como se observa en la figura 2, donde se observa que el estrato medio es el único estrato que presenta pocas variaciones, mientras que los otros estratos mostraron mayores variaciones en relación a las variables, principalmente con la variable DAP, además de la presencia de outliers. Para la clasificación de los diferentes estratos se obtuvo:

Figura 2 Diagrama de caja de los datos DAP y HT en relación a los estratos.  

Figure 2. Box plot of DBH and TH data in relation to strata.

Para el algoritmo Rprop + se obtuvieron cuatro modelos diferentes de redes neuronales artificiales, que obtuvieron valores en la fase de entrenamiento, como se muestra en la tabla 2. Se observa que los modelos A, B, D obtuvieron una constancia en los valores, ya que el modelo D presenta solo la variable HT en la capa de entrada, se demuestra que esta variable tiene mayor peso para el modelo, en contraste, el DAP es un variable menor para pesos. Las configuraciones finales de la red neuronal artificial (modelo D) se muestran en la figura 3, donde se presenta como la mejor RNA para el algoritmo.

Cuadro 2 Valores de la matriz de confusión en porcentaje para el algoritmo RPROP + en la etapa de entrenamiento.  

Para el paso de prueba (tabla 3), para verificar el rendimiento real de los modelos. Tenga en cuenta que los modelos A, B y C fueron capaces de aprender verdaderamente el patrón de los estratos forestales, haciendo coincidir todos los datos. El modelo C, por otro lado, se desempeñó menos que en la etapa de entrenamiento.

Cuadro 3 Valores de la matriz de confusión porcentual para el algoritmo RPROP + en el paso de prueba.  

Se obtuvieron cuatro modelos diferentes para el algoritmo Rprop-, presentados valores en la fase de entrenamiento, como se muestra en la tabla 4. Se observa que las configuraciones de entrada en los modelos E, F y H continúan presentando valores similares, comportamiento también presentado para el Rprop +, demostrando que la variable de mayor peso para el modelo es la variable cuantitativa altura, el modelo G presentó valores menores. La Figura 4 muestra las configuraciones finales de la mejor red neuronal artificial (modelo H) para el algoritmo estudiado.

Cuadro 4 Valores de la matriz de confusión en porcentaje para el algoritmo RPROP- en la etapa de entrenamiento.  

Para los datos de la prueba, se observa que solo los modelos F y G obtuvieron el porcentaje total de aciertos, mientras que los modelos E y G obtuvieron valores más bajos que en la etapa de entrenamiento (tabla 5). Las diferencias entre los algoritmos estudiados son sutiles, ambos mostraron una velocidad satisfactoria en el tiempo de aprendizaje, además de una fácil aplicabilidad. Sin embargo, los modelos A, B y D de Rprop + presentaron los mejores rendimientos como clasificadores. En cuanto a la topología de las redes neuronales artificiales, se observa que el número de neuronas en la capa oculta obtuvo un desempeño satisfactorio en las mejores RNAs, en los que la cantidad se basó en el número de capas iniciales con todas las variables disponibles. No existe un criterio establecido para el número óptimo, sin embargo, este valor puede influir directamente en el rendimiento de la RNA, como se indica (18).

Cuadro 5 Valores de la matriz de confusión en porcentaje para el algoritmo RPROP- en el paso de prueba.  

La función de activación sigmoidea es la más utilizada en estudios que utilizan RNA en ciencias forestales (19), (20), (21), por tanto, este estudio corrobora la demostración del desempeño de esta función para resultados satisfactorios, tanto con un algoritmo que involucra variables cuantitativas como cualitativas para datos de importancia forestal. Dirigiendo a la actualización de los pesos, ya que los pesos se actualizaron de forma aleatoria mediante el software utilizado, se observa que en su formulación de RPROP- saltar mínimos globales no ofreció un buen aprendizaje para las redes neuronales probadas.

En general, el alto desempeño de la red neuronal artificial como modelo clasificador puede explicarse por su mayor característica, que es el aprendizaje a través de ejemplos, de manera que generalice la información que ha aprendido, efectuando la generación de un modelo (22), luego logrando clasificar los datos con mayor precisión. También hay resultados satisfactorios de las RNAs para clasificar los estratos forestales en el estudio de (23), en el que demostró su eficacia con datos recopilados por teledetección. La inteligencia artificial en sí misma es una herramienta fundamental para mejorar los pequeños procesos en el sector forestal, especialmente porque es un recurso renovable a largo plazo con una variedad de biodiversidad, así, este estudio demuestra que un algoritmo de supervisión es capaz de proporcionar estratos forestales de forma más optimizada y con mayor precisión con datos de un bosque nativo.

En el cual estos datos pueden ser utilizados para una planificación forestal más adecuada, ayudando a tomar decisiones más precisas, así como a la aplicación de actividades silvícolas o un plan sustentable orientado a la tala (24). Además de otros procesos que tiene el aprendizaje automático, especialmente las RNAs, se ha venido demostrando principalmente en la estimación de variables difíciles de recolectar, como la altura, una variable clave para el conocimiento de la estratificación forestal, como lo presentan (25), (26), (27), (28). Se demostró entonces la colaboración de esta rama de la ciencia da la computación en las ciencias forestales.

Figura 3 Modelos de redes neuronales artificiales del algoritmo para Rprop +.  

Figure 3. Artificial neural network models of the algorithm for Rprop+.

Figura 4 Modelos de redes neuronales artificiales del algoritmo para Rprop -.  

Figure 4. Artificial neural network models of the algorithm for Rprop-.

Conclusiones

Los modelos de redes neuronales artificiales con el modelo del algoritmo de propagación resiliente en su configuración RPROP + mostraron alta precisión como clasificadores de estratos forestales en un entorno de llanura aluvial, con una alta tasa de aprendizaje, confiabilidad y generalización de datos. La variable altura total (HT) presentó mayor peso para la red neuronal, debido a que el estrato es dependiente de esta variable cuantitativa.

Agradecimientos

Al Programa de Becas de Iniciación Científica y Tecnológica (PROBICT) de la Universidad del Estado de Amapá por promover este estudio. Y a los profesores y académicos del Grupo de Investigación Métodos Cuantitativos Aplicados a los Recursos Forestales.

Referencias

1. T.M. Condé, H. Tonini, ''Fitossociologia de uma Floresta Ombrófila Densa na Amazônia Setentrional, Roraima, Brasil'', Acta Amazonica, vol.43, no.3, Sept., pp.247-260, 2013. [ Links ]

2. R. I. L. Jardim, M. M. Silva, J. C. F. Melo Jr, ''Efeito do Gradiente de Luminosidade sobre Respostas Estruturais de Hyeronima alchorneoides (Phyllanthaceae) em Ambiente Florestal'', Revista Brasileira de Geografia Física, vol. 11, no. 3, Mar., pp. 913-923, 2018. [ Links ]

3. R. L. Chazdon, B. Finegan, R. S. Capers, B. Salgado-Negret, F. Casanoves, V. Boukili, N. Norden, ''Composition and dynamics of functional groups of trees during tropical forest succession in Northeastern Costa Rica'' . Biotropica, vol. 42, no. 1, Jan., pp. 31-40, 2010. [ Links ]

4. B. Moreira, F. A. Carvalho, ''Regeneração de agroflorestas: a importância da cobertura arbórea na transição florestal'',Biotemas, vol.31, no.1, Mar., pp.21-32, 2018. [ Links ]

5. E.N.H. Coronado, et al., ''Multiscale comparisons of tree composition in Amazonian terra firme forests'', Biogeosciences Discussions, vol. 6, no. 11, Nov., pp. 2719-2731, 2009. [ Links ]

6. K.E. Silva, C.R. Souza, C.P. Azevedo, L.M.B. Rossi, ''Dinâmica florestal, estoque de carbono e fitossociologia de uma floresta densa de terra-firme na Amazônia Central'', Scientia Forestalis, vol.43, no. 105, Mar., pp.193-201, 2015. [ Links ]

7. L.F. Brunalti, S.M. Peres, V.F. Silva, C.A.M. Lima, ''Aprendizado de máquina em sistemas de recomendação baseados em conteúdo textual: uma revisão sistemática'', in Simpósio Brasileiro de Sistemas de Informação (SBSI), Porto Alegre, RS, 2015, pp. 203-210. [ Links ]

8. F. Leandro, M.H.F. Tavares, E. Eyng, A.C. Helmann, M.A.M. Andrade, ''Redes Neurais Artificiais: Princípios Básicos'', Revista Eletrônica Científica Inovação e Tecnologia, vol. 1, no. 13, Jan., pp. 47-57, 2016. [ Links ]

9. G.H.A. Pereira, J.A.S. Centeno, ''Avaliação do tamanho de amostras de treinamento para redes neurais artificiais na classificação supervisionada de imagens utilizando dados espectrais e laser scanner'', BCG- Boletim de Ciências Geodésicas, vol.23, no.2, Jun., pp.268- 283, 2017. [ Links ]

10. A.E.D. Vega, ''Modelagem de povoamentos de eucalipto no nordeste da Bahia utilizando regressão e redes neurais artificiais'', M.S. thesis, Universidade Federal de Viçosa, Viçosa, 2018. [ Links ]

11. INMET- Instituto Nacional de Meteorologia . Climas Online. 2020 [ Links ]

12. U.H. Finol, ''Nuevos parâmetros a considerar em el analisis estrutural de las selvas virgenes tropicales'', Revista Florestal Venezoelana, vol.14, no. 21, pp.29-42, 1971. [ Links ]

13. J.R. Scolforo. Manejo Florestal. Lavras: UFLA/FAEPE, 1997, pp.238. [ Links ]

14. F. Gunther, S. Fritsch, ''neuralnet: Training of Neural Network'', The R Journal, vol. 2, no. 1, Jun., pp. 30-38, 2010. [ Links ]

15. S.T.Z. Pauli, ''Diferentes abordagens para o aprendizado da rede neural artificial multilayer perceptron'', M.S. thesis, Universidade Federal do Paraná, Curitiba, 2020. [ Links ]

16. R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing [ Links ]

17. B. Z. Prina, R. Trentin, ''GMC: Geração de Matriz de Confusão a partir de uma classificação digital de imagem do ArcGIS'', in Simpósio brasileiro de sensoriamento remoto, 2015. [ Links ]

18. E. Martins, M. Binoti, H. Leite, D. Binoti, G, ''Configuração de redes neurais artificiais para estimação do afilamento do fuste de árvores de eucalipto'', Revista Brasileira de Ciências Agrárias - Brazilian Journal of Agricultural Sciences, vol.11, no.1, Jun., pp.33-38, 2016. [ Links ]

19. F. A. Leal, E. P. Miguel, E. A. T. Matricardi, R. S. Pereira, ''Redes neurais artificiais na estimativa de volume em um plantio de eucalipto em função de fotografias hemisféricas e número de árvores'',Revista Brasileira de Biometria, vol.33, no.2, pp. 233-249, 2015. [ Links ]

20. Binoti, H .G. Leite, D .H.B. Binoti, J.M. Gleriani, ''Prognose em nível de povoamento de clones de eucalipto empregando redes neurais artificiais'', Cerne, vol. 21, no. 1, Aug., pp. 97-105, 2015. [ Links ]

21. D. G. S. Vendruscolo, A. G. S. Chaves, R. A. Medeiros, R. D. Silva, H. S. Souza, R. Drescher, H. G. Leite, ''Estimativa da altura de árvores de Tectona grandis Lf utilizando regressão e redes neurais artificiais'',Nativa, vol.5, no.1, Mar., pp.52-58, 2017. [ Links ]

22. C. Spörl, E. G. Castro, A. Luchiari, ''Aplicação de Redes Neurais Artificiais na construção de modelos de fragilidade ambiental'', Revista do Departamento de Geografia, vol. 21, no.1, Jul., pp. 113-135, 2011. [ Links ]

23. W.G. Gonçalves, H.M.C. Ribeiro, J.A.S. de Sá, G.P. Morales, H.R. Ferreiro Filho, A.C. Almeida, ''Classificação de estratos florestais utilizando redes neurais artificiais e dados de sensoriamento remoto'', Ambiente & Água-An Interdisciplinary Journal of Applied Science, vol. 11, no. 3, Sept., pp. 612-624, 2016. [ Links ]

24. M.A.S. Souza, C.P. Azevedo, C.R. Souza, M. França, E.L. Vasconcelos Neto. ''Dinâmica e produção de uma floresta sob regime de manejo sustentável na Amazônia central'', FLORESTA, vol. 47, no. 1, Feb., pp. 55 - 63, 2017. [ Links ]

25. G.F. Bueno, E.A. Costa, A.N. Cristina, A.A.V. Soares, R.O.V. Miranda, C.T. Schons, ''Efeito do número de neurônios na camada oculta para relações hipsométricas de eucalipto usando redes neurais artificiais'', BIOFIX Scientific Journal, vol. 5, no. 2, pp. 222-230, 2020. [ Links ]

26. B.P.F. Campos, G.F. Silva, H.B. Binoti, A.R. Mendonça, H.G. Leite, ''Predição da altura total de árvores em plantios de diferentes espécies por meio de redes neurais artificiais''.Brazilian Journal of Forest Research/Pesquisa Florestal Brasileira, vol.36, no. 88, Dec., pp. 375- 385, 2016. [ Links ]

27. E. R. . Martins, , Binoti, H. Leite, D Binoti, G . C. Dutra, ''Configuração de redes neurais artificiais para estimação da altura total de árvores de eucalipto''Revista brasileira de ciências agrárias, vol. 11, no. 2, Jun., pp.117-123, 2016. [ Links ]

28. D. G. S. Vendruscolo, R. Drescher, H. S. Souza, J. P. V. M. Moura, F. M. D. Mamoré, T. D. S. Siqueira, ''Estimativa da altura de eucalipto por meio de regressão não linear e redes neurais artificiais'',Revista Brasileira de Biometria , vol. 33, no.4, pp.556-569, 2015 [ Links ]

Recibido: 06 de Noviembre de 2021; Aprobado: 08 de Abril de 2022

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons