Introducción
El cacao (Theobroma cacao L.) es un cultivo de importancia económica y social en comunidades rurales del trópico y forma parte de un sistema agroalimentario fundamental en la evolución histórica, cultural y comercial de Centroamérica, vinculando alrededor de 15 000 familias que habitan zonas remotas y de difícil acceso (Orozco Aguilar et al. 2007). La región mesoamericana alberga una enorme riqueza de variabilidad genética y es fuente de cacaos con características especiales de sabores y aromas particulares (Zarrillo et al. 2018), los cuales se definen como “cacao fino y de aroma” de acuerdo con la Organización Internacional de Cacao.
Se reconocen dos clases de calidades comerciales, cacao a granel “bulk” (calidad estándar) atribuido particularmente al tipo Forastero, y cacao fino (calidad alta) atribuido a los tipos Criollo y Trinitario. Sin embargo, diversos estudios muestran que independientemente del tipo de cacao, las prácticas postcosecha (fermentación y secado) tienen un papel central en la generación de la heterogeneidad en el perfil de calidad (Papalexandratou et al. 2019, Verce et al. 2021). Además, las condiciones geográficas y agronómicas así como el tipo de suelo, clima, y madurez de la mazorca también influyen en el perfil aromático. Así, los cacaos de distintos orígenes geográficos tienen diferentes características organolépticas que influyen en la calidad del chocolate.
La diferenciación geográfica registrada para granos de cacao es poco común, a causa de una asociación entre la calidad del chocolate y el lugar de origen de las fábricas y centros de transformación final, y no la geografía vinculada a los granos de cacao como materia prima. De forma que, los cacaos mesoamericanos se encuentran desprotegidos ante un uso inadecuado e informal de su procedencia, lo cual destaca la importancia de estudios técnicos en diferentes territorios con producción de cacao que permitan evidenciar una correlación entre calidad y origen geográfico (Hernandez y Granados 2021).
La espectroscopia de infrarrojo cercano (NIR) se posiciona como una técnica rápida y sencilla para evaluar alimentos y productos agrícolas. El principio de esta técnica se basa en la absorción de radiación electromagnética en longitudes de onda de 780 a 2500 nm en una matriz determinada. Sus principales ventajas: 1) la rapidez en la que realiza una medición (entre 15 y 90 segundos), 2) el procedimiento no destructivo de la muestra y 3) el nulo uso de reactivos químicos.
La espectroscopía NIR se ha aplicado en el análisis cualitativo y cuantitativo de granos de cacao: discriminación de granos por el grado de fermentación (Teye et al. 2014); análisis de los niveles de NH3 en la determinación del origen geográfico (Hue et al. 2014); análisis de pH, humedad, índice de fermentación y compuestos fenólicos totales (Anyidoho et al. 2021, Kutsanedzie et al. 2017, Sunoj et al. 2016, Teye 2022, Teye et al. 2015); estimación de compuestos químicos proximales como proteína, grasa, cenizas y carbohidratos totales (Barbin et al. 2018, Forte et al. 2023); incidencia de moho (Kutsanedzie et al. 2018); clasificación geográfica (Anyidoho et al. 2020), y diferenciación entre granos de orgánicos y convencionales (Anyidoho et al. 2021).
Todos los estudios anteriores se han basado en la implementación de enfoques de machine learning para la reducción del ruido espectral y el desarrollo de modelos de predicción. Para obtener la información de los datos espectrales se han aplicado técnicas de análisis quimiométrico, incluidos los mínimos cuadrados parciales (PLS), redes neuronales artificiales (ANN), y máquina de vectores de soporte (SVM).
La combinación de curvas de calibración generadas por espectroscopía NIR con aprendizaje profundo supone una oportunidad para crear métodos de discriminación de calidad y origen del cacao, apoyar estrategias de valorización territorial y gestionar sistemas de trazabilidad de productos diferenciados. Por lo tanto, el objetivo de este trabajo fue validar de la aplicabilidad de un método de discriminación de cacaos según su origen geográfico, mediante el uso de técnicas de espectroscopía NIR portátil y métodos de machine learning. Adicionalmente, se evaluó la aplicación del NIR en la predicción de características de calidad mediante la construcción de modelos generados por análisis proximal y cromatografía liquida de alta resolución (HPLC).
Materiales y métodos
Muestras
Los granos de cacao fermentados y secos se obtuvieron de territorios de Costa Rica asociados a la producción de cacao fino y de aroma, los cuales, para motivos de este estudio, se agruparon de la siguiente manera: Región Huetar Norte (Upala, Guatuso, Los Chiles, Sarapiquí, Pococí, Guácimo, Matina, Limón, Valle de la Estrella), Región Caribe (Talamanca, Puerto Viejo, Sixaola), Región Central (Turrialba), Región Brunca (Valle del General, Coto Brus, Ciudad Neily, Laurel, Paso Canoas), y Centroamérica (Nicaragua, Panamá y El Salvador) durante el periodo 2022 - 2023. Para cada muestra se registró: procedencia, tipología genética, tipo de fermentación. Dentro de los tipos de fermentación se encontró los siguientes: 1) sistemas artesanales con 5-6 días de fermentación en cajones de madera, y 2) sistemas industriales con volúmenes superiores a los 200 kg por lote y 6 días de fermentación en cajones de madera tipo escalera.
Se incluyeron 72 muestras en el conjunto de calibración y 121 muestras en el grupo de predicción. El conjunto de calibración se utilizó para desarrollar el modelo de predicción de las características químicas (Tabla 1), mientras que el conjunto de predicción se utilizó para evaluar el desempeño de los modelos desarrollados.
Tabla 1 Características químicas evaluadas en los granos de cacao utilizados para el desarrollo de la investigación.
Variable | Unidad | Referencia |
Fibra cruda | % | ANKOM Technology (2006) |
Proteína | mg mL-1 | AOAC (2005a) |
Humedad | % | AOAC (2005b) |
Cenizas | % | AOAC (2005c) |
Grasa total | % | AOAC (2005d) |
Acidez titulable | meq 100-1 | Hinneh et al. (2018) |
Epicatequina | mg g-1 | Rojas (2020) |
Teobromina | mg g-1 | Rojas (2020) |
Cafeína | mg g-1 | Rojas (2020) |
Instrumento e información espectral
El espectro de cada muestra se recopiló mediante el espectrofotómetro de infrarrojo cercano (BÜCHI, Suiza). Todas las muestras se procesaron en modo rotatorio durante 15 segundos y los escaneos abarcaron un rango de espectro de luz visible + NIR (400 - 1700 nm) con dos nanómetros de resolución (650 puntos). Se utilizaron dos lámparas distintas denominadas como vista superior o vista inferior del equipo, para los escaneos del conjunto de calibración. Para el conjunto de predicción se utilizó solamente la vista superior. El espectrómetro portátil proporcionó las medidas en partes de absorbancia proporcionales (log 1/R), donde R representa la reflectancia.
Conjunto de calibración
Se utilizaron 72 muestras para la creación del modelo de análisis proximal. Se procesaron 300 g de granos enteros en una licuadora durante 45 segundos (tres intervalos de licuado de cinco segundos con pausas de 10 segundos) con la mínima intensidad. No se realizó descascarillado de los granos ni tamizado del polvo resultante del licuado. Se colocaron 250 g de muestra procesada para la medición con la vista inferior y 10 g de la misma muestra para realizar la medición con la vista superior.
Conjunto de predicción
Se procesaron 50 g de granos enteros en una licuadora durante 45 segundos (tres intervalos de licuado de cinco segundos con pausas de 10 segundos) con la mínima intensidad. No se realizó descascarillado de los granos ni tamizado del polvo resultante del licuado. Se colocaron 10 g de cacao para obtener los espectros según la vista superior del equipo.
Análisis proximal
Se tomaron los 250 g de 72 muestras de granos de cacao molidos utilizados en los escaneos previos para realizar análisis proximales de fibra cruda (ANKOM 2006), proteína (AOAC 2005d), humedad (AOAC 2005b), cenizas (AOAC 2005c) y grasa total (AOAC 2005d).
Compuestos fenólicos
El análisis de cromatografía líquida (HPLC) se elaboró siguiendo la metodología descrita por Rojas (2020), donde los estándares químicos utilizados para comparar los tiempos de retención y las longitudes de onda con las muestras seleccionadas fueron: cafeína, (-) epicatequina y teobromina (Sigma Aldrich, Estados Unidos). Los solventes metanol (MeOH), acetonitrilo y ácido acético (CH3-COOH) fueron grado HPLC (Sigma Aldrich, Estados Unidos). El agua desionizada se obtuvo mediante el sistema Millipore Alpha Q.
Los granos de cacao destinados para el análisis del epicatequina y metilxantinas (teobromina y cafeína) fueron liofilizados (OPERON modelo FDU-7006) durante 48 horas, bajo las condiciones de 0 atm y -83°C. Seguidamente, se les removió la cáscara y fueron molidos con un mortero, posteriormente se almacenaron en un congelador a -20°C.
Para la extracción de grasas, se tomaron 2 g de cacao molido en un tubo plástico cónico, se agregaron 10 ml de hexano y se colocaron en baño ultrasónico a 40ºC por 20 minutos y se sometieron a centrifugación a 25°C y 6607 RCF rpm durante 10 minutos y se descartó el sobrenadante. La muestra fue extraída con 10 ml de metanol-agua a una proporción de 15:6. Se colocó en baño ultrasónico a 40ºC por 20 minutos, se centrifugó a 4807 RCF por 10 minutos, y el sobrenadante fue vertido en un falcon de 50 ml.
El procedimiento se ejecutó tres veces consecutivas, se combinaron las tres extracciones y se aforaron (con el mismo solvente de extracción) a un volumen de 40 ml. El sobrenadante, se volvió a centrifugar por 10 min a 25°C y 6607 RCF, y se filtró a través de filtros de 0,45 µm (Sartorius stedim biotech). Finalmente, se incorporaron en viales para HPLC.
El análisis cromatográfico se efectuó mediante el sistema HPLC Agilent serie 1200 (Agilent Technologies, Estados Unidos), el cual consta de un muestreador automático para viales de 2 mL, una bomba cuaternaria, un detector de diodos (DAD) y un detector ultravioleta (UV). Los componentes fueron separados utilizando una columna Zorbax Eclipse Plus C18 de 4,6 x 100 mm y 3,5 µm (Agilent Technologies, Estados Unidos).
El sistema solvente aplicado consistió en: eluyente A (agua desionizada con 1% ácido acético) y eluyente B (acetonitrilo). El gradiente de elución se programó con un flujo de 1 mL min-1, de la siguiente manera: 100% A por 10 minutos, 75% A por cinco minutos, 50% A por dos minutos, 0% A por un minuto; con un post-acondicionamiento de un minuto. La detección se realizó con el DAD a longitudes de onda de λ 275,4 nm y λ 325,5 nm.
La identificación de los compuestos se realizó con patrones de cafeína, (-) epicatequina, y teobromina utilizando las mismas condiciones descritas del método de HPLC. Los resultados fueron expresados en mili unidades de absorbancia por segundo (mUA s-1), cuyos valores medios (±) de las desviaciones estándar representan un valor aproximado del contenido de tales compuestos. Sin embargo, esto no alude con exactitud la concentración por gramo de cacao desgrasado.
Acidez titulable
Siguiendo la metodología realizada por Hinneh et al. (2018), se molieron 10 g de granos enteros usando una licuadora, los cuales fueron añadidos a un erlenmeyer con 90 mL de agua en punto de ebullición. El homogeneizado se filtró y se enfrió a 20-25°C. A continuación, se tituló una alícuota de 50 mL hasta un punto final de pH de 8,1 con NaOH 0,1 N (Sigma Aldrich, Estados Unidos). En el titulador, la acidez se expresó en meq 100-1 (%). Es importante señalar que este procedimiento no fue para cuantificar el pH real del grano de cacao en sí, sino para medir la acidez derivada de los ácidos del grano que se difunden en el agua.
Preprocesamiento de la información espectral
El análisis quimiométrico se realizó con el programa NIRWise Plus para Windows 10. Se realizó un preprocesamiento de la información espectral para mejorar el conjunto de datos sin procesar y reducir el ruido en los espectros con el método Escalado y Centrado (SNV), el cual resta el promedio y divide por la desviación estándar del vector. El pretratamiento estándar normal variable elimina las interferencias multiplicativas de la dispersión, el tamaño de las partículas y el cambio de la distancia de la luz, por lo que es altamente recomendable para muestras sólidas (Teye et al. 2020). En este caso, se calculó la primera derivada mediante cinco puntos de datos y una ventana de suavizado de cero puntos de datos (BÜCHI s.f.).
Modelos de regresión lineal de predicción para características químicas
Los modelos de calibración para las características químicas estimadas fueron desarrollados con el programa NIRWise Plus para Windows 10 utilizando tres tipos de algoritmos de regresión: regresión de mínimos cuadrados parciales extendida (XLS), regresión de mínimos cuadrados parciales (PLS) y regresión de componentes principales (PCR).
Se realizó una validación cruzada utilizando las 72 muestras de calibración, en donde el algoritmo seleccionó un 80% de dichas muestras como conjunto de calibración y el 20% restante como conjunto de predicción. Para la evaluación de los resultados de la validación individual, se tomaron en cuenta los siguientes estadísticos: R2 de calibración, error estándar de la calibración (SEC), R2 de predicción y error estándar de la validación cruzada (SECV). Esto permitió la comparación de diferentes modelos de predicción.
Modelo de clasificación geográfica
Se utilizó el programa Rstudio para eliminar el ruido de las muestras y corregir debilidades de señal. Se aplicaron técnicas de Escalado y Centrado (SNV), el método de la primer y segunda derivada (D1 y D2), corrección de señal multiplicativa extendida (EMSC) y corrección de dispersión multiplicativa (MSC) y sus combinaciones bajo distinto orden de aplicación. Las derivadas se calcularon a partir del algoritmo de Savitzky-Golay.
Se aplicó un análisis de componentes principales (ACP) para reducir la dimensionalidad de 499 longitudes de onda a la cantidad de componentes donde el porcentaje de varianza acumulada explicase alrededor del 90%.
Se utilizaron las dimensiones obtenidas en ACP y se procedió a realizar un análisis de conglomerados utilizando la distancia Gower, método de agrupamiento Ward y se tomó como criterio para la determinación del número de grupos una línea de corte al 33% del rango de distancia observadas. Además, con los grupos formados, se hicieron tablas de contingencia para determinar la asociación (p<0,05) con las variables “Tipo de producción”, “Región” y “Genética”. Con las variables que fueron significativas se hizo un análisis de correspondencias múltiples para lograr describir los grupos.
Resultados y discusión
Propiedades químicas proximales
Los parámetros descriptivos de las propiedades químicas proximales de cacao seco se muestran en la Tabla 2. La grasa fue el mayor constituyente, en términos porcentuales, del conjunto de muestras, seguido por la proteína. Indicadores tales como epicatequina, la relación teobromina/cafeína, acidez y humedad, mostraron mayor peso en cuanto al coeficiente de variación. Lo anterior apunta a la relevancia del proceso poscosecha en la generación de variabilidad, y resalta la importancia de dichas variables en los criterios de discriminación de muestras según su origen. Estos resultados coincidieron con los publicados por Forte et al. (2023) donde de igual forma se encuentra mayor peso en el coeficiente de variación asociado a indicadores de la fermentación y el manejo poscosecha.
Tabla 2 Resultados de los parámetros químicos estimados en granos de cacao secos durante el desarrollo de la investigación.
- | Mínimo | Máximo | Media | Desviación estándar | Coeficiente de variación (%) |
Acidez (meq 100-1) | 0,78 | 14,35 | 7,354 | 2,573 | 34,980 |
Humedad (m m-1; %) | 4,34 | 12,70 | 7,761 | 1,595 | 20,552 |
Grasa (m m-1; %) | 39,67 | 56,50 | 47,991 | 3,428 | 7,142 |
Proteína (m m-1; %) | 8,83 | 21,43 | 13,114 | 1,633 | 12,450 |
Cenizas (m m-1; %) | 2,24 | 4,62 | 3,539 | 0,371 | 10,489 |
Relación teobromina/cafeína | 1,14 | 18,38 | 6,037 | 3,015 | 49,939 |
Epicatequina (mg g-1) | -1,20 | 9,62 | 3,143 | 1,750 | 55,684 |
Nota: meq = miliequivalentes, % m/m = porcentaje masa/masa.
Características espectrales de los granos de cacao secos
El conjunto de espectros crudos de 193 muestras de cacao seco se presenta en la Figura 1A. El comportamiento espectral observado en las longitudes de onda de 400 a 1700 nm es similar al reportado por otros autores (Forte et al. 2023, Anyidoho et al. 2021). Se aplicó el preprocesamiento quimiométrico de Escalado y Centrado (SNV) a dicho espectro para obtener solo las características útiles de las muestras y construir un modelo confiable. El espectro que resultó de dicho análisis se presenta en la Figura 1B. En ambos gráficos es notable que el espectro visible de menores longitudes de onda (400 - 500 nm) es la región donde se generó mayor ruido.
Los espectros claves fueron en los rangos de 1150-1250, y 1400-1500 nm, correspondientes a grupos funcionales O-H, C-H, C-H2, C-H3, NH2, los cuales están a su vez asociados con carbohidratos complejos, agua, alcoholes alifáticos, grasas, polifenoles, ácidos orgánicos y anillos bencénicos. Específicamente, el contenido de grasa está relacionado con la banda de absorción alrededor de 1200 nm (Hayati et al. 2021), mientras que el contenido de humedad ha sido reportado en las regiones de 1460-1490 nm (Caporaso et al. 2018).

Figura 1. Espectro crudo (A) y espectro posterior a la aplicación del pretratamiento SNV (B) de las muestras de cacao seco analizadas durante el desarrollo de la investigación
El rango 1200 - 1460 nm está relacionado con C-H, C-H2, C-H3, lo cual se asocia a compuestos con anillos bencénicos y fenólicos (tales como epicatequina). De esta manera, este estudio demuestra una alta capacidad del NIR para diferenciar cacao según su grado de fermentación, en respuesta a la variación de epicatequina y polifenoles, los cuales a su vez son indicadores de acidez, amargor y astringencia observado por Anyidoho et al. (2021).
Modelos de regresión lineal para la predicción de parámetros químicos proximales
Los modelos de predicción fueron establecidos con la variable independiente (x) dada por el espectro crudo y con la variable dependiente (y) dada por los contenidos respectivos de cada propiedad. Los estadísticos de cada modelo de predicción para las propiedades químicas se muestran en la Tabla 3. El modelo que obtuvo los valores máximos de coeficiente de correlación para la totalidad de las propiedades químicas fue XLS, en donde la propiedad de humedad presentó el valor máximo (R2 = 0,922) y grasa el valor mínimo (R2 = 0,811), bajo este modelo de regresión lineal. Asimismo, la Figura 2 ilustra los gráficos de regresión lineal para cada una de las propiedades proximales.
Tabla 3 Rendimiento de tres modelos de regresión lineal para siete propiedades medidas utilizando la vista inferior del NIR en cacao seco durante el desarrollo de la investigación.
Método de regresión | Estadísticos | Acidez | Humedad | Proteína | Grasa | Cenizas | Epicatequina | Teobromina/ cafeína |
Regresión de mínimos cuadrados parciales (PLS) | SEC | 0,825 | 0,447 | 0,752 | 1,311 | 0,087 | 0,635 | 0,495 |
- | R2 | 0,845 | 0,863 | 0,622 | 0,872 | 0,845 | 0,857 | 0,847 |
- | SECV | 1,505 | 0,721 | 1,536 | 2,315 | 0,215 | 0,756 | 1,241 |
- | R2 | 0,543 | 0,676 | 0,031 | 0,635 | 0,297 | 0,793 | 0,297 |
Regresión de componentes principales (PCR) | SEC | 1,251 | 0,566 | 0,648 | 2,465 | 0,186 | 0,672 | 1,164 |
- | R2 | 0,628 | 0,806 | 0,759 | 0,576 | 0,293 | 0,840 | 0,405 |
- | SECV | 1,675 | 0,654 | 1,235 | 3,177 | 0,222 | 0,785 | 1,533 |
- | R2 | 0,400 | 0,747 | 0,475 | 0,353 | 0,089 | 0,786 | 0,095 |
Regresión de mínimos cuadrados parciales extendida (XLS) | SEC | 0,636 | 0,358 | 0,500 | 1,643 | 0,075 | 0,521 | 0,460 |
- | R2 | 0,902 | 0,922 | 0,822 | 0,811 | 0,885 | 0,904 | 0,883 |
- | SECV | 0,749 | 0,438 | 0,583 | 2,009 | 0,087 | 0,588 | 0,519 |
- | R2 | 0,865 | 0,888 | 0,759 | 0,722 | 0,848 | 0,878 | 0,853 |
Nota: SEC = error estándar de calibración, R2 = coeficiente de correlación de la regresión, SECV = error estándar de la validación cruzada.
Aplicación del NIR como herramienta de predicción de origen
El análisis Análisis de Componentes Principales (ACP) utilizó 499 lecturas de longitudes a lo largo del espectro implementado (400-1700 nm), reduciendo la dimensionalidad a solamente tres componentes que lograron explicar el 93% de la variabilidad de los datos. Los resultados del agrupamiento basado en un modelo de Clasificación No Supervisada (CNS), utilizando las dimensiones seleccionadas, se muestran mediante un dendograma en la Figura 3, donde se evidenciaron al menos cuatro grupos a una altura de 15 en el eje Y. Se graficaron dichos grupos mediante la asignación de color en la Figura 4.

Figura 3 Dendograma de agrupación a partir de los componentes principales obtenidos de las muestras de cacao seco analizadas durante el desarrollo de la investigación.

Figura 4 Agrupación de las muestras de cacao seco analizadas durante el desarrollo de la investigación según los resultados del dendograma.
En la Tabla 4 se observa la distribución de muestras por origen, según el grupo establecido previamente. El grupo 1 y 2 presentan en su mayoría muestras del Caribe y Región Huetar Norte; en el grupo 3 se agrupan en su mayoría las muestras de la Región Central, Caribe y Región Huetar Norte; y en el grupo 4 se agrupan menor cantidad de todos los orígenes. En un esfuerzo por comprender el peso de propiedades químicas en el agrupamiento por origen, se observa que el grupo 1 incluye muestras con un alto potencial de calidad atribuido a altos contenidos de grasa, así como valores bajos en la relación teobromina/cafeína y en el contenido de epicatequina. En este grupo se observan muestras predominantemente procesadas de manera artesanal, con genéticas basadas en híbridos trinitarios y clones CATIE. En el grupo 2 se incluye un amplio número de muestras con altos valores de acidez y humedad, evidenciando algunas carencias en el manejo poscosecha. En el grupo 3 las muestras presentan menor humedad y acidez, así como bajos valores de epicatequina, con genéticas diversas incluyendo cacaos acriollados e híbridos. El grupo 4 incluye muestras de calidad inferior, reflejada en altos valores de acidez, humedad y epicatequina.
Tabla 4 Asociación de los grupos formados y el origen geográfico de las muestras de cacao seco analizadas durante el desarrollo de la investigación.
- | Grupo | |||
Región | 1 | 2 | 3 | 4 |
Brunca | 3 | 7 | 14 | 2 |
Caribe | 22 | 22 | 26 | 3 |
Huetar Norte | 9 | 13 | 10 | 3 |
Centroamérica | 4 | 0 | 6 | 0 |
Central | 4 | 3 | 18 | 4 |
La débil agrupación que se obtuvo en este estudio demostró que las prácticas poscosecha contribuyen mayormente a la diferenciación de calidad en comparación con el origen geográfico de las muestras, un aspecto que ha sido revisado recientemente por autores (D’Souza et al. 2017, Fanning et al. 2023).
De manera similar Anyidoho et al. (2020) realizaron un estudio para la discriminación por origen en consideración de cuatro países en África, atribuyendo los criterios de segregación a propiedades fisicoquímicas, aunque no demuestran con claridad un agrupamiento por origen. Se demostró el potencial de dicha herramienta en la predicción de propiedades fisicoquímicas derivadas del manejo poscosecha.
La fermentación y el secado del cacao son procesos espontáneos y realizados en finca, con múltiples factores que influyentes que han sido descritos por varios autores (Kongor et al. 2016, Febrianto et al. 2022) provocando una calidad variable del producto terminado. Por su parte, la genética aporta características de composición molecular homogéneas según el cultivar, específicamente contenido de proteína, polisacáridos y polifenoles. Por tanto, es altamente probable producir granos de cacao con un perfil de calidad pobre, según el proceso de fermentación y el secado realizado (De Vuyst y Weckx 2016).
Es una práctica común de los productores de cacao, utilizar mezclas de granos fermentados y secos de diferentes orígenes y prácticas para complementar o contrastar las inconsistencias en calidad, dadas por el proceso poscosecha. Se resalta así la utilidad del NIR primordialmente en el análisis de compuestos químicos macromoleculares, así como de parámetros relacionados con la fermentación, los cuales reducen el peso del efecto de atributos asociados al origen geográfico.
Conclusiones
Este estudio demuestra la utilidad del NIR mediante un abordaje estadístico multivariado para la discriminación rápida, no destructiva y eficiente del cacao por calidad, en consideración de parámetros proximales e indicadores relevantes. Los resultados muestran que un modelo de regresión lineal combinado a pretratamiento de Clasificación No Supervisada (CNS), permite la identificación de calidad de los granos de cacao al mostrar superioridad en la predicción de características químicas proximales. Las técnicas propuestas podrían ser implementadas en el estudio y control de calidad de granos de cacao secos hacia una estimación de parámetros relevantes de fácil operación.
Se debe anotar que el establecimiento de plantaciones de limitada diversidad genética (clones internacionales y comerciales), junto a prácticas poscosecha estandarizadas, contribuye con una minimización del grado de diversidad de calidad asociada al origen geográfico. De manera que, la utilidad del NIR se ve limitada en la identificación de origen y trazabilidad por procedencia. En perspectiva de un espectro limitado al rango de 400-1700 nm, podrían recomendarse estudios con capacidad superior (>1700 nm) y el uso de equipos portátiles complementarios tales como GC MS, NMR, FTIR, entre otros, mediante enfoques de análisis multivariado.