SciELO - Scientific Electronic Library Online

 
vol.31 número3Desarrollo de un sistema de cultivo in vitro de raíces pilosas de Phyllantus acumminatus, para la producción de compuestos con actividad biológicaEfecto del catéter de inseminación y el orden de parto sobre parámetros de producción en ganado porcino índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista Tecnología en Marcha

versión On-line ISSN 0379-3982versión impresa ISSN 0379-3982

Resumen

CALVO-VALVERDE, Luis Alexander  y  VALLEJOS-PENA, Alonso. Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad. Tecnología en Marcha [online]. 2018, vol.31, n.3, pp.74-85. ISSN 0379-3982.  http://dx.doi.org/10.18845/tm.v31i3.3904.

Los datos de alta dimensionalidad plantean un desafío para los algoritmos de agrupamiento tradicionales, ya que las medidas de similitud convencionales utilizadas por estos no son significativas cuando se aplican sobre el espacio completo de datos, por lo que afectan la calidad de los grupos. Ante esto, los algoritmos de agrupamiento de subespacios han sido propuestos como alternativa para encontrar todos los grupos en todos los espacios del conjunto de datos (1).

Al detectar grupos en espacios de menor dimensionalidad, cada grupo detectado puede pertenecer a diferentes subespacios del conjunto de datos original (2). Consecuentemente, atributos que el usuario considere de interés pueden ser excluidos en algunos o todos los grupos, perdiendo información importante y reduciendo el valor del resultado para los analistas.

En este proyecto, se propone un nuevo método que combina el algoritmo SUBCLU (3) y el algoritmo de agrupamiento por restricciones (4), el cual permite al usuario identificar variables como atributos de interés con base en conocimiento previo del dominio, esto con el objeto de dirigir la detección de grupos hacia espacios que incluyan estos atributos y, por ende, generar grupos más significativos.

Palabras clave : Minería de datos; subespacios; SUBCLU; algoritmo de agrupamiento; agrupamiento por restricciones.

        · resumen en Inglés     · texto en Español     · Español ( pdf )