1

Topic: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Maintenant j'ai une question compliquée pour les types qui font des maths et de la statistique (surfin'usa probablement).

En gros en ce moment je suis en train de faire une mise à jour du bouquin d'Arend Lijphart "Patterns of democracy" pour un projet de cours. Je me retrouve avec une série de données, j'aimerais en faire une rotation varimax pour examiner les corrélations entre une dizaine de facteurs. Y'a moyen de faire ça avec excel ?  Quelqu'un sait comment on fait ?

Comme je pourrai probablement pas consulter le site avant un bout de temps, si qui que ce soit peut m'offrir une réponse, fred point sibuet at gmail point com.

Merci d'avance

2

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Tu définis 2 matrices : X et Y
Par exemple : {2.3;4.6} équivaudra à une matrice carrée ayant 2 lignes et 2 colonnes :
[2 3]
[4 6]

Tu peux ensuite utiliser la formule EXCEL : COEFFICIENT.CORRELATION(X;Y) qui te renvoie le coef de corrélation entre les 2 matrices.

Est-ce que ça te va ?

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Anonyme éponyme a écrit:

Tu définis 2 matrices : X et Y
Par exemple : {2.3;4.6} équivaudra à une matrice carrée ayant 2 lignes et 2 colonnes :
[2 3]
[4 6]

Tu peux ensuite utiliser la formule EXCEL : COEFFICIENT.CORRELATION(X;Y) qui te renvoie le coef de corrélation entre les 2 matrices.

Est-ce que ça te va ?

Non, ça ne marche pas du tout.

ce qu'il veut c'est décomposer la variance du nuage de points sur des axes explicatifs (qui sont des combinaisons linéaires d'un jeu de variables), ce qui revient par à faire des projections sur des sous-espaces judicieusement choisis. Cele permettra d'effectuer une réduction de la base de données de sorte de présenter les corrélations les plus importantes entre les variables (et non les individus !!) de façon claire. le choix des axes est primordial.

Justement le choix qu'il propose de faire est d'effectuer une rotation varimax, à savoir générer le premier axe de sorte que la variation soit maximale. les axes suivants seront simplement définis récursivement comme étant orthogonaux au premier.

Donc cela n'a pas grand chose à voir avec un jeu de corrélation deux à deux. Car on veut surtout mettre en jeu des corrélations entre variables et non pas entre individus !! C'est complètement différent.

Excel n'est pas adapté pour l'ACP (Analyse en composante principale), je te conseille d'utiliser R, qui est gratuit et open source.
Il y a d'excellentes explications ici http://pbil.univ-lyon1.fr/R/html/tdr5, en particulier le TDr61 sur l'ACP.

Le package utilisé est ade4

Last edited by RPC (12-01-2010 18:59:31)

Mettre la Chine au pas, ne serait-ce pas mettre le feu à l'Annam ?

4

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Je lui ai simplement dit ce qu'il pouvait faire avec Excel, à savoir calculer des corrélations 2 à 2 wink

Sinon, je lui aurais plutôt recommandé SAS pour les ACP. Enfin bref.

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Anonyme éponyme a écrit:

Je lui ai simplement dit ce qu'il pouvait faire avec Excel, à savoir calculer des corrélations 2 à 2 wink

Sinon, je lui aurais plutôt recommandé SAS pour les ACP. Enfin bref.

En fait il est possible de faire de l'ACP avec excel, mais c'est très sale et j'ai entendu dire que certains des algos utilisés dans des modules ad-hoc sont faux (mais c'est une rumeur).
SAS, beuurk ! Pour avoir souffert avec pendant pas mal d'années, depuis que je suis passé à R, je revis ! Syntaxe claire, graphs magnifiques, possibilités ultra-nombreuses en open-source gratuit. J'invite les stateux intéressés par un logiciel de haut niveau gratuit à s'y mettre.

Et puis SAS, c'est 200 euros une licence étudiant non-conventionné je crois.

De mon point de vue, pour certaines applications comme l'ADD, R surclasse les concurrents (SAS et SPSS).

Last edited by RPC (12-01-2010 20:24:50)

Mettre la Chine au pas, ne serait-ce pas mettre le feu à l'Annam ?

6

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

RPC a écrit:

En fait il est possible de faire de l'ACP avec excel, mais c'est très sale et j'ai entendu dire que certains des algos utilisés dans des modules ad-hoc sont faux (mais c'est une rumeur).

Il y aurait une fonction directe ? Si oui, laquelle ? Sinon, j'imagine qu'avec des macros, on peut très bien se débrouiller, non (je n'ai encore jamais testé) ?
Perso, j'aime bien SAS ;-)

7

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Anonyme éponyme a écrit:
RPC a écrit:

En fait il est possible de faire de l'ACP avec excel, mais c'est très sale et j'ai entendu dire que certains des algos utilisés dans des modules ad-hoc sont faux (mais c'est une rumeur).

Il y aurait une fonction directe ? Si oui, laquelle ? Sinon, j'imagine qu'avec des macros, on peut très bien se débrouiller, non (je n'ai encore jamais testé) ?
Perso, j'aime bien SAS ;-)

Oui oui avec des macros adaptées on peut faire des analyses factorielles sur excel, je l'ai vu faire de mes yeux (mais je ne m'y suis pas risqué, certes) : j'ai retenu qu'on perdait beaucoup de temps pour rien de bien fou, hormis que les graphiques qui en sortent sont toujours meilleurs que sous SPSS, qui n'en délivre pas. Un truc bien c'est qu'on pouvait aussi observer les résultats dans le tableau des modalités (si elles ne sont pas trop nombreuses bien sûr) avec une liste déroulante permettant de choisir l’axe à partir duquel le tableau se réordonnait et des jolies couleurs selon que les valeurs étaient élevées ou basses. Enfin à part ça, effectivement...
Sinon il y a un logiciel de Microsoft adapté à Excel, Excelstat je crois, mais je ne sais pas du tout ce que ça vaut.

8

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

RPC is credit to forum-scpo

Merci les gars

9

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Bah, je suis pas vraiment sûr qu'on t'ai répondu en fait...

10

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Si si, ça a quand même bien aidé.

bon maintenant je file, je n'ai pas des contrôles parentaux installés pour rien.

11

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

broz nl a écrit:

Si si, ça a quand même bien aidé.

Ah. Tu vois, RPC ;-)

12

Re: Besoin d'aide pour faire des statistiques complexes sur Excel (rotation varimax, corrélation de facteurs, Analyse en composante principale...)

Juste pour poster une réponse si cela peut en aider d'autres, voilà ce que je conseille pour faire de l'ACP uniquement avec des logiciels gratuits open-source d'excellente qualité :

1) Soit vous n'avez pas trop de temps et voulez faire des trucs classiques de façon propre et simple sans se prendre la tête.
Je conseille d'utiliser Tanagra, qui est un petit freeware très très bon (mais est orienté data mining) très simple d'usage (clic bouton) :  http://eric.univ-lyon2.fr/~ricco/tanagr … nagra.html

Le tuto sur les ACP et rotation varimax est dispo ici (c'est vraiment très simple) : http://tutoriels-data-mining.blogspot.c … n-acp.html


2) Soit vous avez du temps et un usage assez poussé des stats en général : je conseille d'utiliser R, qui est parfaitement gratuit.
Un manuel très bien fait et très clair est disponible ici : http://cran.r-project.org/doc/contrib/B … ntro_R.pdf
Il y a un moteur de recherche dédié R : http://www.rseek.org/
des exemples graphiques pour illustrer la puissance du logiciel : http://addictedtor.free.fr/graphiques/

Voilà !

Mettre la Chine au pas, ne serait-ce pas mettre le feu à l'Annam ?