Análisis de Componentes Principales en presencia de datos faltantes: el principio de datos disponibles

Víctor Manuel Gonzalez Rojas, Gabriel Conde Arango,Andrés Felipe Ochoa Muñoz

Scientia et Technica(2021)

Cited 2|Views0
No score
Abstract
espanolEn este trabajo proponemos utilizar el principio de datos disponibles derivado del algoritmo NIPALS (Nonlinear estimation by Iterative Partial Least Square) para trabajar el Analisis de Componentes Principales (ACP) en presencia de datos faltantes. Esta propuesta es importante puesto que no realiza imputacion de datos, ni se descartan individuos de la base datos, el metodo propuesto trabaja con los elementos pares disponibles para conformar las matrices de cuasicorrelacion en ?? y ?? en la descomposicion espectral de estas matrices permite a traves de las relaciones de transicion realizar un ACP convencional. Del estudio de simulacion realizado se encontro que a medida que aumenta el porcentaje de datos faltantes disminuye la inercia explicada en el primer plano factorial. Se desarrollo el algoritmo de solucion bajo el entorno de programacion R y se anexa el codigo para uso libre. EnglishIn this paper we propose to use the principle of available data derived from the NIPALS (Nonlinear estimation by Iterative Partial Least Square) algorithm to work on the Principal Components Analysis (PCA) in the presence of missing data. This proposal is important since it does not perform data imputation, nor are individuals discarded from the database; the proposed method works with the available pairs to form the quasicorrelation matrices in ?? and in ??; the spectral decomposition of these matrices allows through the transition relations to realize a conventional PCA. From the simulation study carried out, it was found that as the percentage of missing data increases, the inertia explained in the first factorial plane decreases. The solution algorithm was developed under the R programming environment and the code is appended for free use.
More
Translated text
Key words
datos disponibles,datos faltantes,análisis
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined