SciELO - Scientific Electronic Library Online

 
vol.21 número1Interstatis: el método statis para datos de tipo intervaloColonia de abejas artificiales y optimización por enjambre de partículas para la estimación de parámetros de regresión no lineal artificial índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista de Matemática Teoría y Aplicaciones

versión impresa ISSN 1409-2433

Rev. Mat vol.21 no.1 San José ene./jun. 2014

 

Gnm-nipals: estimación general no métrica y no lineal por mínimos cuadrados parciales iterativos

Gnm-nipals: general nonmetric-nonlinear estimation by iterative partial least squares

Tomás Aluja** Víctor Manuel González*

*Dirección para correspondencia:

Resumen

En este trabajo se desarrolla GNM-NIPALS para formar parte de los métodos NM-PLS, el cual permite cuantificar las variables cualitativas de una matriz de datos mixtos mediante una función lineal de k componentes principales, tipo reconstitución, maximizando la inercia en el plano kdimensional asociado al ACP de la matriz así cuantificada. Es entonces una generalización del algoritmo NM-NIPALS que usa solo la primera componente principal en la cuantificación de variables cualitativas. De la maximización y positividad de la razón de correlación entre cada variable cualitativa y la función reconstituida, se tiene que la inercia acumulada en el plano k-dimensional asociado a la función de cuantificación del mismo rango, es mayor o igual que la generada en planos de igual dimensión pero con funciones de cuantificación de diferente rango. Con las k componentes principales asociadas a la matriz así cuantificada, se desarrolla el análisis de inercia saturada para evaluar si aún existe una dimensión k* < k, a partir de la cual la inercia acumulada en los ejes de orden igual o superior ya esta explicada, caso en el cual la función de cuantificación definitiva es de rango menor (k*).

Palabras clave: NM-PLS, ACP, datos mixtos, cuantificación, k-dimensional, inercia saturada, maximal, razón correlación.

Abstract

This paper develops GNM-NIPALS as an extension of the NM-PLS methods, which allows to quantify the qualitative variables of mixed data, by means of the reconstitution function using the first k principal components, maximizing the inertia in the plane k subspace associated with the PCA of the quantified matrix. It generalizes the NM-NIPALS algorithm in the sense that the latter only uses the first principal component in the quantification of qualitative variables. From the maximization and positivity of the correlation ratio between each qualitative variable and the reconstituted function, we have that the accumulated inertia on the kdimensional subspace associated to the quantification function of the same range is greater than or equal to the one generated on subspaces of equal dimension, but with quantification functions of different range. With the k principal components associated to the quantified matrix, a saturated inertia analysis is performed to evaluate if a dimension k* < k still exists, from which the accumulated inertia on the axes of equal or superior order is already explained, in which case the definitive quantification function is of lesser range (k*).

Keywords: NM-PLS, PCA, mixed data, quantification, k-dimensional, saturated inertia, maximal, correlation ratio.

Mathematics Subject Classification: 62H25.


Ver contenido disponible en pdf


Referencias

[1] Aluja, T.;Morineau, A. (1999) Aprender de los Datos: El Análisis de Componentes Principales. EUB S.L, Barcelona.         [ Links ]

[2] Escofier, B.; Pàges, J. (1992) Análisis Factoriales Simples y Múltiples: Objetivos, Métodos e Interpretación. Servicio Editorial Universidad del País Vasco, Bilbao.         [ Links ]

[3] Lebart, L.; Morineau, A.; Piron, M. (2006) Statistique Exploratoire Multidimensionnelle. Dunod, Paris.         [ Links ]

[4] Russolillo, G. (2012) “Non-metric partial least squares”, Electronic Journal of Statistics 6: 1648–1655.         [ Links ]

[5] Saporta, G. (2011) Probabilités, Analyse des Données et Statistique. Editions Technip, Paris.         [ Links ]

[6] Tenenhaus, M. (1998) La Régression PLS. Théorie et Pratique. Editions Technip, Paris.         [ Links ]

[7] Wold, H. (1975) “Path models with latent variables: The non-linear iterative partial least squares (NIPALS) approach”, Academic Press, New York: 307–357.         [ Links ]

[8] Young, F. (1981) “Quantitative analysis of qualitative data”, Psychometrika 44(4): 357–388.         [ Links ]

*Correspondencia a:
Tomás Aluja: Laboratori de Modelització i Anàlisi de la Informació (LIAM), Universitat Politècnica de Catalunya, Barcelona, España. E-Mail: tomas.aluja@upc.edu
Víctor Manuel González: Misma dirección que/same address as: Barcelona, España. E-Mail: victor.manuel.gonzalez.rojas@upc.edu
*Laboratori de Modelització i Anàlisi de la Informació (LIAM), Universitat Politècnica de Catalunya, Barcelona, España. E-Mail: tomas.aluja@upc.edu
Misma dirección que/same address as: Barcelona, España. E-Mail: victor.manuel.gonzalez.rojas@upc.edu

Received: 7/May/2013; Revised: 14/Nov/2013; Accepted: 15/Nov/2013

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons