La méthode des composants principaux est basée sur des tentativesexpliquer le niveau maximum de variance dans un certain ensemble de variables, et se concentrer sur les éléments situés dans la matrice de corrélation le long de la diagonale. Il existe une autre méthode basée sur l'analyse factorielle visant à approximer la matrice de corrélation en utilisant un certain nombre de facteurs (moins d'un nombre donné de variables), mais les méthodes d'approximation diffèrent sensiblement de la première méthode proposée.
Ainsi, la méthode d'analyse factorielle nous permet d'expliquer la corrélation entre les variables elles-mêmes, et est orientée sur les éléments d'une matrice de corrélation qui sont en dehors de sa diagonale.
Basé sur une application pratique, nous allons essayercomprendre le besoin d'appliquer telle ou telle méthode. L'analyse factorielle est utilisée lorsque le chercheur s'intéresse à l'étude de la relation entre les variables, la méthode des composantes principales est utilisée dans le cas de la nécessité de réduire la dimensionnalité des données et dans une moindre mesure nécessite une interprétation de celles-ci.
Basé sur la pratique, nous pouvons voir que les méthodesL'analyse factorielle utilise un assez grand nombre d'observations. Dans le même temps, cette quantité doit être supérieure d'un ordre de grandeur au nombre de facteurs détectés.
La méthode des composants principaux est très populairedans la recherche marketing, puisqu'il peut être utilisé en présence de données initiales multicollinéaires. Dans le cadre d'une telle recherche marketing, les questionnaires contiennent des questions similaires et les réponses reçues correspondent aux principes de la multicolinéarité.
La méthode des composants principaux est opportientenvisager dans l'ensemble des indicateurs, qui devrait être pour le chercheur un point de référence avec un choix préliminaire du nombre de composants ou de facteurs. Les plus importantes d'entre elles sont les valeurs propres, exprimant la variance des variables, expliquées par ce facteur. Il y a aussi une règle empirique importante, très utile pour estimer le nombre de facteurs (il doit y avoir autant de facteurs que de valeurs propres sur un). Il est possible d'expliquer cette règle d'une manière un peu plus simple: les valeurs propres expriment la fraction des variances normalisées des variables expliquées par le facteur, et dans le cas d'un dépassement, elles doivent exprimer ces variances contenues dans plusieurs variables.
Il est nécessaire de clarifier une fois de plus cette règleLes «valeurs propres individuelles» sont empiriques et la question de la nécessité de leur application ne peut être résolue que par le chercheur lui-même. Par exemple, une valeur propre a une valeur inférieure à un, mais elle explique l'écart qui est réparti entre les variables. Pour un spécialiste en marketing, il est très important que lorsque la segmentation des facteurs identifiés ont une signification significative. Et ces facteurs contenant leurs propres nombres au-dessus de l'unité, mais n'ayant pas une interprétation significative, ne seront pas pris en compte. Et la situation peut survenir au contraire.
Un autre problème important lié à la pratiquel'application de méthodes d'analyse factorielle - la question de la rotation. De telles variantes de rotation peuvent être considérées. Le plus populaire d'entre eux est la méthode Varimax. Il est basé sur l'atteinte du niveau maximum de variance des variables pour chaque facteur individuel. Cette méthode aide à trouver une rotation dans laquelle certaines variables prennent des valeurs élevées, alors que d'autres - sont suffisamment faibles pour chaque facteur individuel.
Une autre méthode de rotation est le quartax, elle aide à trouver un certain tour dans lequel les facteurs pour chaque variable individuelle ont des charges faibles et élevées.
La méthode de rotation d'equimax est un compromis entre les deux méthodes discutées ci-dessus.
Toutes ces méthodes se rapportent à des axes orthogonaux avec perpendiculaires l'un à l'autre et, lorsqu'ils sont utilisés, il existe un manque de corrélation entre les facteurs individuels.
</ p></ p>