En matemática, la teoría de conjuntos1 se establece a partir de fundamentos como la relación de pertenencia, y operaciones básicas como: unión, intersección, diferencia y diferencia simétrica,2 que definen las relaciones entre los elementos.
Gracias a esta estructura, es posible descubrir conjuntos particulares con base en información implícita contenida en conjuntos más generales.
Su aplicación no se restringe a temas relacionados con las ciencias exactas, pues también ha sido aplicada en áreas como la infectología, particularmente en enfermedades como la infección por el virus de inmundeficiencia humana (VIH).
Tan solo en 2011, cerca de 34 millones de personas tenían esta infección, y casi el 60% de quienes viven con el VIH desconocen su estado serológico, lo que obstaculiza la toma de un tratamiento oportuno. Pero las cifras más alarmantes se evidencian en África Subsahariana y África Meridional, siendo la región más afectada del mundo.3
Esta enfermedad produce una inmunosupresión progresiva generada por el retrovirus VIH, que afecta de manera progresiva no solo las células o linfocitos T responsables de coordinar la respuesta inmune celular, sino también los ganglios linfáticos, los macrófagos o células del sistema inmune que se ubican en los tejidos y que expresan el CD4, y las células dendríticas foliculares (CDF).
Basándose en lo anterior, para evaluar el avance de esta enfermedad en el tiempo, y determinar la terapia antirretroviral más adecuada, es necesario analizar la cantidad total de leucocitos y linfocitos junto con el número de linfocitos T CD4 presentes en la sangre. Los primeros son obtenidos mediante el examen del cuadro hemático de manera fácil y a bajo costo, mientras que, para determinar el conteo de CD4, es preciso llevar a cabo un examen específico denominado citometría de flujo, que no solo cuenta con desventajas como su alto costo o la baja cobertura en países en vía de desarrollo,4 sino que también presenta inconvenientes como la baja tasa de transmisión de células, la medida del comportamiento individual de estas y el requerimiento de operadores capacitados.5
Dado que se tiene el término de conjunto y el concepto de VIH/sida para relacionarlos entre sí, se establecieron parámetros basados en estudios del cuadro hemático de pacientes en el tiempo, a partir de ciertos rangos de valores.
Observaciones previas determinaron que pacientes con menos de 1500 linfocitos totales, suelen tener menos de 500 linfocitos CD4/μl, y los que tienen más de 1500 linfocitos totales, más de 200 linfocitos CD4/ μl.6
Con el fin de encontrar valores más precisos en el conteo de CD4, se han desarrollado diversos modelos de predicción, entre ellos modelos de índole automatizado con un porcentaje del 83% de precisión, desarrollado con base en la carga viral y el número de semanas a partir de las cuales se realizó el inicio del conteo de CD4.7 Otro modelo de carácter epidemiológico aplicado en Zambia y Sudáfrica, con porcentajes de exactitud entre el 76% y el 82%, respectivamente, evidenció patrones de variación en el recuento de CD4, tanto para individuos como para poblaciones en casos sin y con VIH/sida,8 resultados confirmados en tres cohortes en los Estados Unidos.9
Varios trabajos han desarrollado algoritmos basados en aprendizaje de máquina con redes neurales, que relacionan el genotipo y datos del tratamiento de la enfermedad, obteniendo porcentajes de exactitud del 75%10 y el 69%11 en la predicción de la carga viral. Otros algoritmos de enfoque predictivo para determinar el éxito o fracaso en los tratamientos, han incluido también la respuesta dicotómica del virus,12 con una precisión del 80%, así como comportamientos a nivel genotípico del VIH, producidos como reacción ante la terapia antirretroviral combinada.13 Aunque el enfoque hacia la predicción específica del conteo de CD4 no fue el factor predominante, los estudios evidencian que es posible establecer órdenes matemáticos de diferentes fenómenos asociados al desarrollo del VIH/sida.
Por otro lado, a través de teorías físicas y matemáticas se han desarrollado herramientas diagnósticas objetivas y reproducibles. Específicamente, Rodríguez et al. han desarrollado una metodología para predecir linfocitos T CD4 con base en valores individuales de leucocitos y linfocitos totales del hemograma mediante la teoría de conjuntos, determinando su pertenencia a 3 conjuntos que definen el comportamiento de leucocitos/ml3 respecto a linfocitos/ml3 y respecto a CD4/µl3.
Para determinar la efectividad de la predicción,6,14 se ordenaron de mayor a menor los registros de acuerdo con el número de leucocitos, definiendo rangos de a 1000 y evaluando la pertenencia de las muestras de cada rango, a los conjuntos evaluados. Se estableció un rango superior para valores mayores a 10000/ml3 y un rango inferior para valores menores a 4000/ml3.
La aplicabilidad clínica de esta metodología, especialmente en los menores rangos de leucocitos, ha sido confirmada en dos estudios posteriores con 50015 y 800 muestras.14 Ambos trabajos tuvieron porcentajes de efectividad superiores al 81,44% en 5 de los 9 rangos medidos, así como una efectividad igual o superior al 91,89% en el rango de leucocitos menor a 4000, y una efectividad del 100% en la predicción del rango inferior a 3000.14,15
De ahí que la finalidad de este trabajo es no solo aplicar la metodología desarrollada con base en la teoría de conjuntos, a la predicción matemática de linfocitos TCD4 a partir de tripletas de diferentes cuadro hemáticos, sino también, establecer la utilidad de este método para realizar seguimientos de la evolución de los pacientes en el tiempo.
Métodos
Definiciones
Rangos de leucocitos: rangos de 1000 leucocitos, iniciando con 3000 hasta 10000; valores mayores a 10000 corresponden a un solo rango, y valores menores o iguales a 2999 constituyen otro rango.15
Donde (x, y, z) se define como una tripla de valores donde x representa el número de leucocitos, y, el número de linfocitos y z, el conteo de linfocitos T CD415.
Procedimiento
El estudio se desarrolló con base en la información del cuadro hemático y de la citometría de flujo de 33 pacientes, 21 de los cuales contaban con 4 muestras y 12 con 5, tomadas en diferentes momentos. La información provino de una base de datos de investigaciones previamente desarrolladas, y fue evaluada por un infectólogo experto. Todos los pacientes estaban en tratamiento antirretroviral y contaban con edades entre 27 y 46 años; 18 de los pacientes eran hombres y 15, mujeres.
A partir de un estudio previo4 se establecieron las triplas de valores de leucocitos/mm3, linfocitos/mm3 y CD4/µl para cada muestra, y su pertenencia a cuatro conjuntos: A, B, C y D (ver definiciones). El conjunto A se define por un número de leucocitos (x), un número de linfocitos (y) y un número de linfocitos T CD4 (z), tales que, el número de leucocitos (x) es mayor o igual que 6800 y el número de linfocitos (y) es mayor o igual que 1800. De manera semejante se hace con los demás conjuntos.
Luego se determinó la pertenencia al conjunto (A( C) , que permite evaluar las relaciones específicas entre los valores de leucocitos respecto a linfocitos. Del mismo modo se evaluó el conjunto (B ( D) , que evalúa las relaciones específicas entre leucocitos y CD4. Finalmente se realizó la predicción, que en términos matemáticos corresponde a asumir la pertenencia al conjunto (A ( C) ∩ (B ( D) , de tal modo que dicha intersección establece la relación matemática entre los tres valores. Es decir, con la unión se asocian todos los valores que pertenecen al conjunto A con C y B con D; en cambio, en la intersección solo quedan asociados los valores que pertenecen simultáneamente a los conjuntos (A ( C) y (B ( D).
A continuación se organizaron las triplas de mayor a menor, de acuerdo con su cantidad de leucocitos/mm3, y se agruparon según los rangos definidos, con el fin de establecer el número de triplas perteneciente a cada conjunto evaluado, conforme a cada rango.
Por último se estableció la capacidad de la metodología predictiva aplicada para realizar predicciones acertadas en la evolución en el tiempo de los pacientes. Para ello se estudiaron las condiciones que presentaban los pacientes cuya evolución en el tiempo presentara los porcentajes de predicción más precisos, así como aquellos en los que se lograran porcentajes de predicción más bajos.
A nivel normativo, cabe resaltar que este trabajo cumple con las condiciones tratadas dentro de la Resolución No. 008430 de 1993, de manera particular en su título 11, relacionado con la investigación en seres humanos, al estar clasificado en la categoría de investigación sin riesgo, por realizarse sobre información de investigaciones previas. Los cálculos matemáticos no afectan a los pacientes y el manejo de la información respeta su integridad y anonimato.
Resultados
Al evaluar las 144 muestras correspondientes a los 33 pacientes evaluados, los valores de leucocitos en sangre periférica se encontraron entre 1900 y 17850 por mm³, los linfocitos totales se hallaron entre 70 y 5910 por mm³, y los conteos de CD4 oscilaron entre 21 y 1366 por µL. Debido a la cantidad de casos utilizados para la presente investigación, se realizó un cuadro a modo de ejemplo, presentando las triplas de cuatro pacientes específicos. En ellas se puede observar que todos están dentro de los rangos descritos. (Cuadro 1)
El conjunto (A ( C) presentó porcentajes de predicción que variaron entre el 50% y el 100%; el conjunto (B ( D) presentó valores entre el 50% y el 100%, y finalmente el conjunto (A( C) ∩ (B ( D) reportó valores entre el 50% y el 100% (Cuadro 2).
Se hallaron porcentajes de predicción iguales o superiores al 75% en 6 de los 9 rangos estudiados, de los cuales, los rangos de leucocitos inferiores a 5000 presentan valores de pertenencia al conjunto (A( C) ∩ (B ( D) progresivamente mayores, de tal forma que para los rangos inferiores a 5000, 4000 y 3000, se establece una predicción del recuento de CD4 con valores inferiores a 570 CD4, logrando un porcentaje de efectividad del 85,71%, el 83,33% y el 100%, respectivamente. Se encontró además, que el rango de 8999 a 8000 presentó uno de los valores más altos de porcentaje de efectividad, igual al 88,89% (Cuadro 2).
Como resultado de la observación de la capacidad predictiva de la metodología respecto a un mismo paciente en diferentes momentos, se determinó que los pacientes cuya enfermedad se encontraba en estados más avanzados, que se pueden observar por los bajos valores de CD4 reportados, asociados a valores bajos de leucocitos (menores a 5000 ml3), son los que pueden ser seguidos en el tiempo de forma más fiable con esta metodología, al presentar los porcentajes de predicción más altos. Es así como los pacientes con medidas asociadas a valores de leucocitos menores a 5000, presentaron porcentajes de predicción entre el 83,33% y el 100%. En contraposición, pacientes portadores del virus, pero que no han desarrollado todavía la enfermedad avanzada, presentan valores predictivos más bajos, al asociarse a rangos de leucocitos superiores a 5000 (Cuadros 1 y 2).
Discusión
Este es el primer trabajo que aplica una predicción basada en la teoría de conjuntos y que establece un número de CD4/ µL, con base en los recuentos de leucocitos y linfocitos, a 4 o 5 muestras consecutivas de pacientes en el tiempo, confirmando su aplicabilidad clínica para el seguimiento de la evolución de pacientes con VIH/sida. Mediante esta metodología es posible contribuir a una atención terapéutica oportuna y de fácil acceso a pacientes con VIH, específicamente cuando su recuento de CD4 se encuentre en un estado mínimo.
Se hallaron porcentajes de predicción iguales o superiores al 75% en 6 de los 9 rangos evaluados, los cuales en su mayoría corresponden a los rangos inferiores a 5000 leucocitos, logrando establecer predicciones del 85%, el 83% y el 100%, para los rangos de 5000, 4000 y 3000, respectivamente. Abordar de manera físico-matemática el problema permitió simplificarlo y aplicarlo a la clínica, independientemente de variables como edad, tipo de tratamiento, género, carga viral o hemoglobina, siendo un resultado de alto impacto en la clínica, más aún en países en vías de desarrollo que carecen del acceso a exámenes como la citometría de flujo.
El análisis de la evolución de los pacientes en el tiempo evidenció que se logran mejores porcentajes de predicción en pacientes que ya han desarrollado sida y por tanto tienen valores menores de CD4 y de leucocitos. Esto resulta de gran importancia clínica, por ser los pacientes que requieren un seguimiento más minucioso en el tiempo, para establecer la eficacia a corto plazo de los tratamientos antirretrovirales. En contraposición, pacientes con valores de leucocitos superiores a 5000, presentan valores predictivos menores, lo que indica la necesidad de desarrollar un refinamiento sobre la metodología planteada, que permita aumentar los porcentajes de predicción en estos rangos.
En la actualidad, los países en vía de desarrollo tienen problemas en el seguimiento clínico de los pacientes y la toma de decisiones terapéuticas respecto la administración del tratamiento antirretroviral, debido al alto costo de la citometría de flujo para el recuento de CD4. La poca cobertura de este análisis en los países que más lo necesitan disminuye la posibilidad de administración de antirretrovirales,5 a pesar de los esfuerzos promocionados por la OMS para el acceso a esta terapia.16 Por lo anterior, resulta de utilidad contar con métodos de fácil acceso y de mayor disponibilidad a nivel mundial, de ahí que la predicción del número de CD4 con base en los recuentos de leucocitos y linfocitos hallados en el hemograma, constituye una opción práctica y económica ante esta problemática.
La teoría de conjuntos permitió comprender el comportamiento matemático del fenómeno; por sus características, las muestras presentan siempre mayores posibilidades de pertenecer a los conjuntos A y C, que son los que establecen el comportamiento de los linfocitos; por otro lado, los valores disminuyen al evaluar los conjuntos B y D que establecen el comportamiento de CD4. En consecuencia, el comportamiento de la intersección entre ambos conjuntos presenta porcentajes iguales o menores al conjunto (B ( D) .
Gracias al análisis simultáneo del comportamiento de leucocitos y linfocitos asociado a la evaluación de los CD4 en los diferentes rangos, la teoría de conjuntos permite establecer una predicción del comportamiento de los CD4, al indicar que se encontrarán menos de 570 CD4/µl con una seguridad del 100% para valores inferiores a 3000 leucocitos/mm3.
Los modelos desarrollados en la última década han tenido un enfoque estadístico y empírico, basado en métodos epidemiológicos o redes neurales10-13para la predicción de CD4, lo que implica una restricción en su aplicabilidad a las muestras poblacionales de las cuales se parte. En contraposición, la metodología propuesta fue desarrollada desde la forma de pensamiento inductiva de la física y la matemática, logrando a partir de una inducción realizada con solo 7 casos, predicciones aplicables a cada uno,6 que fueron confirmadas en estudios con poblaciones cada vez mayores, para garantizar su aplicabilidad clínica.14,15 Un estudio adicional realizado a partir de la teoría de conjuntos y la teoría de la probabilidad, permitió evidenciar mediante el cálculo de la desviación media cuadrática, que el comportamiento de los conjuntos no era equiprobable, sino que existía un comportamiento “cargado”, el cual permitía el establecimiento de predicciones, cuya efectividad dependerá del rango evaluado.17